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内 容 简 介 


本 书 侧重 于 介绍 DB2 数据 库 的 性 能 调 优 。 性 能 调 优 是 一 个 系统 工程 : 全 面 监控 分 析 操 作 系统 、IO 性 能 、 


内 存 、 应 用 及 数据 库 才 能 快速 找到 问题 根源 ， 深 刻 理解 DB2 的 锁 及 并 发 机 制 、 索 引 原 理 、 数 据 库 参 数 、 优 化 
器 原理 、 统 计 分 析 和 碎片 整理 等 内 部 机 理 才 能 针对 性 地 快速 提出 解决 问题 的 方法 ， 快照 、db2pd、db2expln 以 


及 各 种 管理 视图 和 表 消 数 等 则 是 必须 熟练 掌握 的 工具 。 本 书 窗 新 了 进行 DB2 数据 库 性 能 调 优 所 需 的 全 部 知识 
和 工具 ， 并 提供 了 大 量 的 性 能 调 优 的 实际 案例 ， 这 些 案例 都 基于 作者 10 多 年 积累 的 经 验 和 总 结 ， 其 中 包括 了 
近年 来 大 型 银行 系统 实际 过 到 的 案例 。 本 书 还 首次 涵盖 了 针对 DB2 pureScale 及 同城 双 活 GDPC( 地 理 上 分 离 的 
pureScale 集群 ) 的 性 能 调 优 方法 和 实践 。 
本 书 适合 有 一 定 DB2 数据 库 基 础 知识 和 经 验 的 数据 库 工 程 师 ， 以 及 希望 深入 、 全 面 地 和 擎 握 DB2 数据 库 性 
E 分 机 和 调 优 知 识 的 谈 者 ， 同 时 可 以 成 为 数据 库 软 件 开发 人 员 开 发 高 性 能 数据 库 软 件 的 参考 书 。 
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序 


关系 型 数据 库 已 经 走 过 整 整 半 个 世纪 册 折 而 交 煌 的 历程 ， 回 顾 50 年 的 关系 数据 库 发 
展 史 ,我 们 心潮 涌 动 , 激情 难 抑 。 关 系数 据 库 始 于 1970 年 BM 公司 研究 员 EF.Codd 博士 
“关系 数据 库 之 父 ”, 及 表 的 业界 第 一 篇 关于 关系 数据 库 理论 的 论文 ”<A Relational Model 
of Data for Large Shared Data Banks”。 从 此 关系 型 数据 库 如 雨 后 春 劳 役 四 处 是 发 ， 各 大 三 
商 争 先 侣 后 ， 加 入 到 关系 型 数据 库 的 研发 大 潮 中 ， 而 后 义 如 大 浪 淘 沙 般 去 正 和 存 具 ， 时 全 今 
日 ， 留 下 的 是 真正 适用 于 客户 、 适 应 于 潮流 的 关系 型 数据 库 产 品 。 

IBM 公司 作为 关系 数据 库 的 推广 先锋 ， 为 业界 提供 了 一 批 优秀 的 数据 库 技术 领域 先驱 
科学 家 ， 他 们 所 研发 出 的 DB2 数据 库 ， 经 过 近 50 年 的 发 展 ， 已 经 广泛 应 用 于 金融 、 电 信人、 
制造 等 多 个 行业 ， 对 日 常 的 工作 和 生活 带 来 了 深远 的 影响 。 

在 中 国 ，DB2 数据 库 的 兴起 大 概 在 15 年 前 ， 当 时 国内 鲜 有 应 用 ， 千 新庄 先生 作为 国 
内 首 批 接触 研究 DB2 数据 库 的 工程 师 ， 为 业界 提供 了 大 量 拉 术 服务 和 专业 培训 ， 为 DB2 
数据 库 的 推广 应 用 做 出 了 积极 杰出 的 贡献。 同时， 也 为 BM 公司 反馈 了 很 多 很 好 的 DB2 
研发 建议 , 为 关系 型 数据 技术 的 长 远 发 展 页 献 智慧 。 在 数据 库 方向 的 精深 造 诺 和 丰富 实践 
就 浓缩 在 他 的 DB2 数据 库 著作 中 ， 为 广大 IT 同仁 授 业 解 惑 

木 套图 书 可 以 说 是 伴随 着 DB2 数据 库 的 成 长 ,从 第 一 版 主讲 DB2 V8, 到 第 二 版 的 DB2 
V9， 再 到 第 三 版 的 DB2 V10。 基 本 上 每 出 一 个 版 本 我 都 会 仔细 品味 ， 每 个 版 本 作者 都 很 用 
心 ， 部 会 删 减 对 当前 不 适用 的 划 广 ， 加 入 很 多 独 的 功能 和 他 近期 实际 经 历 的 案例 。 经 典 性 、 
权威 性 、 实 用 性 是 本 套 书籍 锁定 的 主要 目标 ， 

第 一 ， 本 和 套 书 籍 池 坦 了 DB2 的 几乎 所 有 功能 ， 有 是 业界 最 大 规模 的 系统 柄 理 与 总 结 。 从 
理论 知识 到 最 佳 实践 ， 无 所 不 包 ， 无 所 不 有 ， 同 时 还 总 结 了 几 十 个 最 佳 案 例 。 

第 二 , 本 套 书籍 理论 讲解 深入 浅 出 ,案例 多 样 详实 ,无 论 是 对 零 基 础 还 是 拥有 多 年 DBA 
工作 经 验 的 人 都 非常 适用 。 
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第 三 ， 精 品 的 价值 在 于 传世 和 久远， 经 典 的 意义 在 于 和 常 读 常 新 。 我 认为 ， 只 有 被 广泛 阅 
读 ， 受 到 大 家 喜爱 、 接 受 的 作品 ， 才 具有 经 典 的 资质 与 意义 。 和 希望 作者 继续 努力 ， 将 本 套 
书籍 打磨 成 关系 数据 库 的 经 典 图 书 。 

其 中 第 一 本 书 《循序 渐进 DB2 DBA 系统 管理 、 运 维 与 应 用 案例 (第 3 版 )》， 是 DB2 
学 习 的 入 门 书籍 。 该 书包 含 了 从 入 门 到 中 级 阶段 的 知识 和 技能 的 介绍 ， 全 和 面 展示 了 DB2 
的 主要 功能 和 日 常 的 工作 技巧 ， 尤 其 是 实例 和 案例 部 分 ， 这 部 分 内 容 从 实际 出 发 为 读者 列 
举 了 常见 的 案例 场景 和 处 理 办 法 , 非常 实用 。 在 新 的 一 版 中 , 所 有 的 内 容 、 示 例 都 基于 DB2 
V10.5 版 本 进行 了 修订 ， 并 介绍 了 DB2 V11.1 中 的 新 功能 、 新 特性 。 

第 二 本 书 《DB2 融 级 管理 、 系 统 设计 与 诊断 案例 (第 3 版 )》 是 DB2 学 习 的 高 级 进 阶 ， 
该 书 从 DB2 体系 结构 入 手 ， 介 绍 了 DB2 各 个 内 部 组 件 的 层 放 与 功能 、 内 存 内 部 结构 、 存 
储 内 部 结构 、 锁 和 并 发 原理 等 。 在 理解 DB2 内 部 基本 原理 的 基础 上 进一步 介绍 了 DB2 的 
高 级 功能 ， 包 括 分 区 功能 、 高 级 压缩 功能 等 。 此 外 ， 系 统 介绍 了 OLITP 和 OLAP 系统 的 设 
计 方 法 和 管理 技术 、 融 可 用 和 容 灾 方案 , 以 及 集群 技术 , 其 中 涉及 HADR、DPF 和 pureScale 
扩 术 ， 以 及 地 理 上 分 离 的 pureScale 集群 (GDPC) 技 术 。 该 书 还 介绍 了 DB2 各 种 监控 和 诊断 
方法 ， 通 过 精 选 的 诊断 守 例 使 谈 者 在 学 习 知 识 的 同时 积累 实践 经 验 。 

第 二 本 书 《DB2 数据 库 性 能 调整 和 优化 (第 3 版 )》 专 门 介绍 DB2 性 能 调整 和 优化 ， 从 
DB2 数据 库 性 能 有 关 的 基础 知识 和 原理 入 手 ， 从 数据 库 所 处 的 运行 环境 (OS、 存 储 等 ) 开 始 
介绍 , 并 对 DB2 的 进程 和 内 存 进行 深入 讲解 。 在 全 面 了 解 性 能 相关 知识 后 , 开始 逐步 展开 ， 
从 设计 到 监控 ， 从 配置 参数 到 调 优 工具 ， 从 锁 和 并 发 到 优化 器 统计 信息 ， 最 后 列 出 了 几 个 
完整 的 性 能 调 优 案例 以 增加 技术 理解 。 

祝愿 每 一 位 读者 能 有 所 得 、 有 所 悟 ， 成 长 为 新 一 代 的 数据 技术 专家 ， 也 祝愿 牛 新 庄 先 
生 在 数据 技术 领域 这 条 康 庄 大 道上 走 得 更 宽 更 远 。 


IBM 前 大 中 华 区 总 经 理 
IBM 大 中 华 区 融 级 顾问 


王 大 我 


山 


日 1999 年 左右 我 开始 从 事 数 据 库 有 关 的 技术 工作 到 现在 已 近 20 年 时 间 ， 此 期 间 信息 
科技 飞速 发 展 ， 从 无 纸 化 办 公 和 数据 大 集中 到 移动 互联 和 大 数据 、 人 工 智 能 、 云 计算 等 信 
县 技术 改变 了 生活 , 并 着 履 了 传统 商业 模式 。 信 息 科 技 的 发 展 离 不 开 数 据 处 理 技术 的 进步 ， 
在 这 一 轮 信息 化 浪潮 中 ， 数 据 处 理 技术 也 发 生 了 翻天 履 地 的 变化 ， 对 企业 经 营 发 展 和 对 外 
服务 的 意义 越 来 越 重要 。 一 方面 ， 传 统 企业 级 数据 库 的 能 力 ， 在 原 有 的 道路 和 方向 上 不 断 
地 持续 提升 演进 ， 以 满足 企业 市 场 不 断 进发 的 各 类 需求 。 另 一 方面 ， 互 联网 场景 孕育 的 各 
种 新 兴 的 数据 处 理 技术 亦 不 断 涌现 ， 例 如 NewSQL、NoSQL、Hadoop 等 大 数据 处 理 技术 ， 
这 些 技术 成 为 传统 数据 库 产品 的 必然 补充 ， 同 时 也 对 传统 数据 库 产 品 产 生 了 一 定 的 冲击 。 
但 是 以 我 长 期 从 事 企业 数据 处 理 相关 工作 的 经 验 看 ， 在 企业 级 市 场 尤 其 是 金融 企业 市 场 里 
面 ， 传 统 数 据 库 产品 的 能 力 依然 是 解决 企业 主要 业务 需求 的 不 二 选择 。 因 此 ， 传 统 数 据 库 
技术 的 研究 和 应 用 仍然 是 信息 科技 工作 的 重点 。 

近年 来 传统 数据 库 产 品 在 不 断 改 进 升 级 ， 以 文 持 更 快 的 处 理 能 力 和 更 高 的 可 用 性 ， 满 
足 不 同 场景 下 的 用 户 需 求 。DB2 作为 一 款 主流 数据 库 产品 ， 在 这 些 方面 也 都 进步 明显 ， 例 
如 Purescale 集群 技术 、 跨 数据 中 心 的 GDPC 技术 、 列 存储 的 BLU 技术 等 创新 功能 就 表现 
不 俗 ， 满 足 了 特定 业务 场景 需求 ， 给 企业 市 来 了 很 大 的 价值 提升 。 特 别 是 GDPC 技术 ， 
帮助 企业 搭建 关键 业务 系统 同城 对 等 全 双 活 生产 架构 ， 为 最 终 用 户 提 供 高 等 级 容 灾 的 连 
续 服 务 ， 对 企业 对 外 服务 的 提升 意义 非凡 ， 也 使 数据 库 从 业者 们 领略 了 DB2 产品 创新 的 
精华 。 

基于 DB2 产品 的 演进 以 及 近 些 年 的 思考 和 实践 ， 我 重新 梳理 了 之 前 编写 的 第 2 版 的 3 
本 DB2 系列 技术 图 书 , 对 其 进行 了 大 育 幅 的 修改 和 重 与 , 力图 对 近 些 年 实践 的 精华 和 DB2 
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产 梧 的 新 趋势 进行 忌 结 。 在 此 奉献 给 各 位 数据 库 从 业 的 同仁 ， 在 技术 的 路 上 共勉。 

由 于 本 人 水 平 有 限 ， 时 间 有 限 ， 书 中 不 免 有 这 样 或 者 那样 的 蚀 误 ， 布 望 广 大 读 痢 朋友 
不 音 赐教 指正 ! 

最 后 ， 感 谢 我 的 家 人 和 同事 在 本 书 重 写 过 程 中 的 帮助 ， 谢 谢 你 们 ! 


牛 新 庄 
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为 什么 要 进行 性 能 调 优 昵 ? 因为 我 们 的 应 用 系统 在 运行 一 段 时 间 后 ， 用 户 报告 系统 运 
行 会 变 慢 ， 使 他 们 不 能 完成 所 有 的 工作 ， 完 成 事务 和 处 理 查 询 花 费 了 过 长 的 时 间 ， 或 者 应 
用 程序 在 一 天 中 的 某 些 时 段 变 慢 。 要 确定 造成 问题 的 本 质 原 因 ， 必 须 评估 系统 资源 的 实际 
使 用 情况 并 进一步 地 分 析 资 源 使 用 的 瓶颈 所 在 。 

用 户 通常 报告 以 下 性 能 问题 : 

e 事务 或 查询 的 啊 应 时 间 比 预期 的 长 

e 事务 厨 吐 量 不 足以 完成 必需 的 工作 负载 

e 事务 否 吐 量 减 少 

为 了 维持 数据 库 应 用 程序 的 最 优 性 能 ， 应 该 制定 一 个 计划 用 于 评估 系统 性 能 ， 以 便 在 
性 能 出 现 问 题 时 , 该 计划 可 以 根据 性 能 问题 的 情况 对 数据 库 做 出 调整 ,以 维持 良好 的 性 能 。 
定期 的 、 特 定 的 评估 能 够 帮助 您 预见 并 纠正 性 能 问题 。 通 过 尽早 识别 出 问题 ， 可 以 有 效 地 
防止 这 些 问题 严重 地 影响 用 户 。 

本 章 我 们 将 通过 一 个 实际 生产 中 的 客户 案例 ， 展 开 对 性 能 调整 的 讲解 。 本 章 主 要 内 容 
包括 : 
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e 什么 时 候 需 要 性 能 调整 
e 性 能 调整 准则 
e 性 能 调整 的 方法 和 过 程 
e 你 持 民 好 性 能 


1.1 性 能 概述 


自 先 让 我 们 以 一 个 丰 实 银行 的 应 用 案例 来 展开 性 能 调整 的 话题 ， 图 1-1 和 图 1-2 分 别 
为 该 行 手 机 银行 系统 的 好 辑 染 构 部 普 图 和 物理 架构 部 普 图 。 
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图 1-1 茶 手 机 银行 系统 的 逻辑 结构 图 


图 1-2 中 的 手机 银行 系统 是 一 个 大 型 的 复杂 系统 。 在 这 个 系统 中 ， 从 上 至 下 包括 以 下 
几 个 层次 : 应 用 程序 、 中 间 件 应 用 服务 器 、 数 据 库 、 主 机 系统 (操作 系统 )、 光 纤 交 换 机 和 
SAN 存储 网 络 (EMC VMAX)。 在 系统 发 生性 能 问题 时 ， 性 能 问题 的 定位 和 调 优 很 复杂 。 


图 1-2” 某 手 机 银行 系统 的 物理 结构 图 


该 手机 银行 系统 的 信息 架构 如 下 : 
存储 : 采用 的 是 EMC VMAX 存储 系统 
操作 系统 : IBM AIX 7.1 (p750 lpar) 
数据 库 : IBM DB2 9.7 
中 间 件 : Oracle Weblogic 
Web 服务 右 : Linux Apache Server 
应 用 : 采用 基于 J2EE 的 Java 应 用 
该 系统 目 从 2013 年 上 线 以 来 ， 业 务 量 逐年 增长 ， 运 行人 至今 ， 对 最 终 用 户 的 交互 啊 应 
速度 不 如 预期 。 在 主机 系统 上 观察 ，CPU 较 忙 ， 在 业务 运 低 时 一 直 保持 在 $0% 左 右 。 手 机 
银行 系统 由 业务 应 用 程序 、DB2 数据 库 、AIX 主机 、EMC 存储 多 个 部 分 组 成 ， 因 此 性 能 
狂人 须 的 定位 和 性 能 的 优化 都 比较 复杂 。 
那么 我 们 如 何 来 解决 这 些 性 能 问题 呢 ? 有 两 种 方法 : 
e 第 一 种 方法 是 我 们 可 以 通过 扩容 硬件 物理 资源 (增加 CPU、 内 存 以 及 购买 更 快 的 存 
储 系统 ) 来 实现 。 
e 第 二 种 方法 是 我 们 试图 对 应 用 系统 做 出 相应 的 调整 来 优化 系统 以 改善 目前 的 
情况 。 
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第 一 种 方法 我 们 需要 投入 更 多 的 经 济 成 本 ， 而 第 二 种 方法 需要 我 们 利用 经 验 来 对 整个 
系统 做 出 调整 。 本 书 中 要 介绍 的 是 第 二 种 方法 。 

在 进行 调整 之 前 ， 您 有 必要 先 了 解 关 于 性 能 调 优 方面 的 某 些 话题 。 

自 先 , 性 能 的 概念 是 什么 呢 ? 性 能 是 业务 应 用 系统 (例如 我 们 本 章 所 举 的 手机 银行 系统 
案例 ) 在 特定 硬件 资源 (例如 32 路 CPU、128GB 内 存 ) 和 工作 负载 下 所 表现 出 来 的 处 理 能 力 。 
性 能 主要 通过 系统 响应 时 间 、 香 吐 量 和 可 用 性 来 衡量 。 

性 能 受 以 下 因素 影响 : 

e 系统 中 可 用 的 物理 资源 

e 如 何 充分 合理 地 利用 这 些 资源 

一 般 情 况 下 ， 通 过 性 能 调整 我 们 可 以 完成 以 下 目标 : 

e 处 理 更 大 的 或 更 紧迫 的 工作 负载 ， 而 不 增加 处 理 成 本 ， 例 如 增加 工作 负载 而 不 用 

购买 新 硬件 或 占用 更 多 处 理 器 时 间 
e。 获得 更 快 的 系统 响应 时 间或 更 大 的 吞吐 量 ， 而 不 增加 处 理 成 本 
e 降低 处 理 成 本 ， 而 不 会 降低 对 用 户 的 服务 


1.2 ”性 能 评估 


以 下 评估 摘 述 了 事务 处 理 系 统 的 性 能 : 
e 五 吐 量 

响应 时 间 

每 个 事务 的 成 本 

资源 利用 率 


1. 否 吐 量 


吞吐 量 用 于 评估 系统 的 整体 性 能 。 对 于 事务 处 理 系统 ,吞吐 量 通常 用 每 秒 事务 数 (TPS) 
或 每 分 钟 事 务 数 (TPM) 来 计量 。 吞 叶 量 取决 于 以 下 因素 : 
。 服务 器 硬件 资源 配置 
软件 中 的 处 理 开 销 
磁盘 上 数据 的 布局 
硬件 和 软件 都 支持 的 并 行 度 
正在 处 理 的 事务 类 型 


2. 响应 时 间 


响应 时 间 用 于 评估 单个 事务 或 查询 的 性 能 。 通 常 认为 ， 响 应 时 间 是 从 用 户 输 入 一 个 命 
令 或 激活 一 个 功能 开始 一 直到 应 用 程序 指示 已 完成 该 命令 或 功能 所 消耗 的 时 间 。 典 型 DB2 
应 用 程序 的 啊 应 时 间 包 括 以 下 操作 序列 (以 查询 为 例 ， 每 个 操作 都 需要 一 定 的 时 间 ， 啊 应 时 
间 不 包括 用 户 思考 和 输入 查询 或 请 求 的 时 间 ): 

(1) 应 用 程序 将 查询 请 求 转发 到 数据 库 服务 器 。 

(2) 数据 库 服务 器 执行 查询 优化 并 检索 所 有 用 户 定义 的 例 程 ， 生 成 该 查询 对 应 的 执行 
计划 。 

(3) 数据 库 服务 器 按照 执行 计划 检索 出 适当 的 记录 ， 如 果 该 记录 当前 不 在 内 存 中 ， 
则 还 需要 磁盘 IO 操作 。 

(4) 数据 库 服务 器 在 执行 查询 的 过 程 中 ， 有 可 能 还 会 执行 一 些 后 台 操 作 ， 这 些 操 作 也 
有 可 能 影响 查询 的 响应 时 间 ( 比 如 记录 日 志和 清除 赃 页 面 )。 

(5) 数据 库 服务 占 将 结果 返回 给 应 用 程序 。 

(6) 应 用 程序 将 数据 库 结果 返回 给 用 户 ， 等 待 用 户 的 进一步 操作 。 

图 1-3 显示 了 步 又 (1)~(6) 中 所 述 的 操作 如 何 作 用 于 整体 啊 应 时 间 。 


数据 库 服 务 器 客户 机 应 用 程 库 
侣 执行 理 


检索 或 添加 选 接收 、 处 并 
定 的 记录 示 来 自 数据 库 服 
务 器 的 结果 


总 响应 时 间 
图 1-3 事务 的 响应 时 间 


3. 响应 时 间 和 吞吐 量 

啊 应 时 间 和 吞吐 量 是 相关 联 的 。 在 您 增加 总 体 吞 吐 量 时 一 般 单个 事务 的 啊 应 时 间 会 增 
加 ， 因 此 您 必须 权衡 符 吐 量 和 啊 应 时 间 的 关系 。 您 可 以 通过 为 特定 查询 分 配 不 成 比例 的 资 
源 数量 ， 在 牺牲 总 体 符 吐 量 的 情况 下 减少 该 查询 的 响应 时 间 。 与 之 相反 ， 可 以 通过 限制 数 
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据 库 分 配给 大 型 查询 的 资源 数 来 维持 总 体 春 吐 量 。 

当 尝 试 在 对 高 事务 吞吐 量 的 当前 需求 和 对 执行 大 型 决策 支持 查询 的 即时 需求 之 间 取 
得 平衡 时 ， 大 吐 量 与 响应 时 间 之 间 的 平衡 就 变 得 明显 起 来 。 应 用 于 查询 的 资源 越 多 ， 可 用 
于 处 理事 务 的 资源 就 越 少 ， 并 且 查 询 对 事务 春 吐 量 的 影响 就 越 大 。 相 反 ， 提 供给 查询 的 次 
源 越 少 ， 查 询 花费 的 时 间 就 越 长 。 


4. 每 个 事务 的 成 本 


每 个 事务 的 成 本 是 财务 上 的 量度 ， 通 常用 于 比较 应 用 程序 、 数 据 库 服务 器 或 硬件 平台 
之 则 的 总 体操 作成 本 。 

要 评估 每 个 事务 的 成 本 ， 通 党 采用 下 和 面 的 方法 : 

(1) 计算 与 运行 应 用 程序 相关 的 有 所 有 成 本 ,这 些 成 本 可 能 包括 价 件 和 软件 的 安装 成 本 、 
运作 成 本 及 其 他 费用 。 

(2) 设计 应 用 程序 有 效 期 的 事务 和 答 询 的 总 数 。 

(3) 用 总 成 本 除 以 事务 总 数 。 

尽管 该 测量 对 于 进行 规划 和 评估 很 有 用 ， 但 是 它 与 达到 最 佳 性 能 的 运行 问题 几乎 
Ts 

5. 资源 利用 率 和 性 能 

资源 利用 率 与 负载 关 型 和 并 发 性 有 很 大 关系 ， 一 天 、 一 周 、 一 月 、 一 年 中 的 峰值 负载 
以 及 决策 文 持 (Decision Support System，DSS) 碍 询 或 备份 操作 所 施加 的 负载 对 于 任何 容量 
将 用 尽 的 系统 者 会 产生 明显 的 影响 。 比 如 银行 的 核心 系统 ， 既 要 满足 每 天 的 存 取 亚 处 理 ， 
义 要 满足 各 种 批量 程序 的 大 并 发 处 理 ， 如 果 您 只 考虑 了 每 天 的 存 取 计 处 理 而 忽略 了 大 并 发 
的 批量 处 理 ， 那 么 分 配 过 低 的 系统 资源 无 疑 会 对 访 系 统 造成 毁灭 性 的 影 啊 。 

因此 在 系统 上 线 之 前 和 上 线 之 后 必须 对 系统 的 工作 负载 和 性 能 进行 定期 评估 ， 以 预测 
峰值 负载 并 比较 使 用 周期 中 不 同时 刻 的 性 能 指标 ， 通 过 趋势 分 析 来 确定 未 来 的 容量 需求 。 
定期 评估 有 助 于 为 数据 库 服务 器 上 的 应 用 程序 开发 总 体 的 性 能 概要 文件 ， 该 概要 文件 对 于 
确定 如 何 可 徘 地 提高 性 能 具有 关键 意义 。 

关于 操作 系统 提供 的 用 于 评估 对 系统 和 人 硬件 资源 的 性 能 影响 的 工具 ， 请 参阅 本 书 第 2 
章 “ 操 作 系 统 及 存储 的 性 能 调 优 ”。 

资源 利用 率 是 与 系统 资源 可 用 的 总 时 间 相 比 ， 该 系统 资源 实际 被 占用 的 时 间 的 白 分 
比 。 例 如 ， 如 果 CPU 在 一 分 钟 内 总 共用 42 秒 处 理事 务 ， 那 么 在 这 段 时 间 间 隔 内 的 利用 率 
就 是 70%。 

定期 评估 并 记录 以 下 系统 资源 的 利用 率 ， 


® (PU 

。 内 存 

。 位 得 

e。 网 络 

当 某 项 资源 被 过 度 使 用 或 者 它 的 利用 率 与 其 他 系统 资源 的 利用 率 不 成 比例 时 ， 就 称 该 
资源 对 于 性 能 是 临界 的 。 例 如 ， 当 一 个 磁盘 的 繁忙 率 达 到 70%， 而 系统 中 其 他 所 有 磁盘 的 
繁忙 率 只 有 30% 的 时 候 , 可 以 认为 该 磁盘 是 临界 的 或 是 被 过 度 使 用 的 。 尽管 70% 并 不 表示 
磁盘 被 严重 过 度 使 用 ， 但 可 以 通过 重新 安排 数据 来 平衡 整个 磁盘 集 上 的 IO 请 求 ， 从 而 提 
高 系统 的 性 能 。 

如 何 评估 资源 利用 率 取决 于 操作 系统 为 报告 系统 活动 和 资源 利用 率 所 提供 的 工具 。 一 
旦 发 现 看 起 来 被 过 度 使 用 的 资源 ， 就 可 以 使 用 数据 库 服务 器 的 性 能 监视 实用 程序 来 收集 数 
据 ， 并 对 可 能 占用 该 系统 资源 上 负载 的 数据 库 活动 进行 干涉 。 可 以 调整 数据 库 的 配置 参数 
或 操作 系统 的 相关 IO 配置 ， 以 减少 那些 数据 库 活动 或 将 它们 分 散 到 其 他 资源 中 (关于 这 部 
分 的 详细 内 容 请 参见 本 书 第 2 章 )。 


1.3 建立 性 能 目标 


性 能 调整 的 目标 是 提高 系统 的 吞吐 量 ， 缩 短 系统 的 啊 应 时 间 ， 文 持 众多 的 并 发 用 户 ， 
缩短 数据 加 载 的 时 间 。 
无 论 是 正在 设计 还 是 在 维护 系统 ， 您 都 应 该 建立 专门 的 性 能 目标 ， 它 使 您 知道 何 时 要 
做 调整 。 如 果 您 试图 胡乱 地 改动 配置 参数 或 SQL 语句 ， 就 可 能 会 浪费 调整 系统 的 时 间 ， 甚 
至 会 使 性 能 变 得 更 粮 糕 。 
为 数据 库 服务 器 及 其 支持 的 应 用 程序 建立 性 能 目标 要 考虑 许多 注意 事项 。 建 立 性 能 
标 时 ， 请 考虑 以 下 问题 : 
e 您 最 关注 的 是 什么 ? 是 最 大 化 事务 吞吐 量 、 最 小 化 特定 查询 的 啊 应 时 间 还 是 实现 
两 者 的 混合 ? 
e 在 向 单 的 事务 (OLTP) 请 求 、 复 洒 的 决策 文 持 查询 (DSS) 请 求 和 其 他 类 型 ( 批 处 理 、 
报表 等 ) 请 求 之 间 ， 数 据 库 服务 器 通常 处 理 什 么 类 型 的 请 求 或 混合 的 请 求 ? 
e 您 需要 高 性 能 还 是 高 可 用 性 ? 有 了 时候 为 了 达到 蜗 性 能 就 需要 承受 数据 丢失 的 风险 。 
在 什么 时 候 您 布 望 用 事务 处 理 速度 (性 能 ) 与 可 用 性 或 丢失 特殊 事务 的 风险 相交 换 ? 
e 您 期 望 的 最 大 并 发 用 户 数 和 最 大 事务 量 是 多 少 ? 
e 您 的 配置 受 内 存 、 磁 盘 空 间或 CPU 等 资源 的 限制 吗 ? 
这 些 问 题 的 回答 能 够 帮助 您 为 资源 和 应 用 程序 设置 合理 的 现实 的 性 能 目标 。 
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1.4 什么 时 候 需 要 做 性 能 调整 


多 数 人 认为 只 有 当 用 户 感觉 性 能 差 时 才 进 行 调整 ， 此 时 即使 使 用 调整 过 程 中 最 有 效 的 
调整 策略 ， 往 往 也 太 述 了 。 此 时 ， 如 果 你 不 愿意 重新 设计 应 用 的 话 ， 就 只 能 通过 重新 分 配 
内 存 或 调整 VO 的 办 法 或 多 或 少 地 提高 性 能 。DB2 提供 了 许多 特性 ， 这 些 特性 只 有 应 用 到 
正确 设计 的 系统 中 时 才能 够 很 大 地 提高 性 能 。 

其 实 ， 性 能 调整 应 该 路 越 整 个 应 用 系统 的 开发 生命 周期 。 不 光 是 DBA 用 户 ， 所 有 系 
统 用 户 都 会 以 某 种 方式 对 性 能 产生 影响 ， 这 包括 数据 库 服务 器 管理 员 、 数 据 库 管理 员 、 应 
用 程序 设计 人 员 和 客户 机 应 用 程序 用 户 。 

数据 库 服务 器 管理 员 通 第 要 协调 所 有 用 户 的 活动 ， 以 确保 系统 性 能 达到 总 体 预 期 效 
果 。 例 如 ， 操 作 系 统管 理 员 可 能 需要 重新 配置 操作 系统 以 增加 共享 内 存量 ， 或 关闭 操作 系 
统 以 安装 新 的 配置 ， 这 需要 关闭 数据 库 服务 器 。 此 时 ， 数 据 库 服务 器 管理 员 必 须 对 这 个 停 
机 时 间 做 出 安排 ， 并 向 所 有 受 影 响 的 用 户 通 知 系统 将 在 何 时 不 可 用 。 


e 了 了 解 上 友 生 的 所 有 与 性 能 相关 的 活动 ， 使 用 户 了 解 性 能 的 重要 性 ， 与 性 能 相关 的 活 
动 是 如 何 影 啊 他 们 的 ， 以 及 如 何 协助 以 获得 并 保持 最 佳 性 能 。 


数据 库 管理 员 应 该 注意 : 

表 和 和 奏 询 如 何 影 响 数据 库 服 务 器 的 总 体 性 能 。 

表 和 表 分 区 的 位 置 。 

创建 最 合理 的 款 引 和 配置 参数 。 

观察 SQL 的 执行 计划 是 否 最 优 ， 统 计 分 析 是 否 已 经 过 时 。 

数据 在 磁盘 上 的 分 布 是 如 何 影 啊 性 能 昼 

存储 的 IO 设计 , 数据 库 的 物理 设计 和 逻辑 设计 , 操作 系统 的 条 市 宽度 、 条 市 深度 、 
LO 读 与 方式 等 。 


e ”数据 库 的 技术 染 构 如 何 有 影响 总 体 性 能 。 


应 用 程序 开发 者 应 该 : 

。 仔细 设计 应 用 程序 ， 使 用 数据 库 服务 器 提供 的 并 行 和 排序 工具 ， 而 不 是 尝试 实施 
应 用 程序 中 的 类 似 工具 。 

。 将 锁 的 作用 域 和 持续 时 间 保持 在 最 小 值 ， 避 免 对 数据 库 资源 的 争 用 。 

。 在 应 用 程序 中 包含 例 程 ， 它 们 可 以 在 应 用 程序 运行 时 被 临时 启用 ， 以 允许 数据 库 
服务 器 管理 员 监 视 响应 时 间 和 事务 吞吐 量 。 


e 在 应 用 程序 的 设计 和 编 但 阶段 ,应 用 设计 人 员 应 考 碟 哪些 DB2 特性 对 系统 有 好 处 ， 
并 使 用 这 些 特性 。 还 应 该 在 该 阶段 对 SQL 语句 和 存储 过 程 进 行 调整 优化 。 同 时 做 
好 数据 库 物 理 设 计 和 逻辑 说 计 ， 用 最 合适 的 数据 库 技 术 来 解决 应 用 中 的 业务 需求 
(例如 表 分 区 、 物 化 僵 询 表 、 表 压 绚 等 技术 )。 


数据 库 用 尸 应 该 : 

e 注意 性 能 并 及 时 间 数 据 库 服 务 硕 管理 员 报告 问题 。 

e 在 调度 大 的 决策 文 持 合 询 和 请 求 时 保持 谍 让 ， 尺 可 能 使 用 少量 的 资源 来 完成 工作 。 

有 了 民 好 的 系统 设计 ， 你 就 可 以 在 应 用 系统 的 生命 周期 中 最 小 化 性 能 调整 的 代价 。 最 
有 效 的 调整 时 间 是 在 设计 阶段 , 在 设计 期 间 的 调整 能 以 最 低 的 代价 换 来 最 大 的 收益 。 当 然 ， 
即使 在 设计 很 好 的 系统 中 ， 也 可 能 有 人 性 能 降低 。 但 这 些 性 能 降低 应 该 是 可 控 的 和 可 以 预 
见 的 。 

但 是 很 遗憾 的 是 ， 国 内 的 大 部 分 应 用 系统 往往 是 上 线 运行 一 段 时 间 后 ， 才 发 现 很 多 性 
能 问题 都 是 由 于 最 初 设计 阶段 没有 好 好 地 进行 调整 寻 致 的 。 所 以 ， 性 能 调整 其 实 路 越 整 个 
应 用 系统 的 开发 生命 周期 。 


1.5 ”性 能 调整 准则 


以 下 准则 可 帮助 您 制订 调整 性 能 的 总 体 方案 。 

1. 记 住 递减 返回 定律 : 最 大 的 性 能 收益 通常 来 自 于 最 初 的 努力 ， 以 后 的 更 改 通常 只 能 
产生 越 来 越 小 的 效益 ， 并 且 需 要 更 多 投入 。 

2. 不 要 只 为 调整 而 调整 : 进行 调整 是 为 了 解决 性 能 瓶 氏 。 如 末 调 整 的 资源 不 是 造成 性 
能 问题 的 主要 诛 因 ， 那 么 这 种 调整 对 性 能 问题 几乎 不 产生 影响 ， 而 且 这 种 调整 会 干扰 您 的 
判断 ， 为 后 续 的 调整 工作 市 来 困难 。 因 此 调整 的 关键 在 于 对 症 下 约 ， 找 到 影 啊 性 能 因素 的 

3. 考虑 整个 系统 : 永远 不 要 片面 地 调整 某 个 参数 。 在 进行 任何 调整 前 ,务必 考虑 此 次 
调整 将 对 整个 系统 市 来 的 影响。 要 综合 地 考虑 系统 价 件 、 存 储 设计 、 数 据 库 配置 参数 、 数 
据 库 的 物理 设计 和 过 辑 设 计 、 统 计 信 息 、 中 间 件 配置 参数 和 编程 拉 术 。 

4. 一 次 更 改 一 个 参数 : 不 要 一 次 更 改 多 个 性 能 调整 参数 。 即 使 您 能 肯定 所 有 更 改 都 有 
好 处 , 也 没有 任何 办 法 来 评估 每 个 更 改 押 市 来 的 影响 。 每 次 调整 一 个 参数 来 改进 一 方面 时 ， 
几乎 总 是 会 影响 人 至少 一 个 您 可 能 没有 考虑 到 的 其 他 方面 。 因 而 ， 如 果 一 次 更 改 多 个 参数 ， 
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就 不 能 有 效 地 判断 每 个 更 改 的 利 次 。 通 过 一 次 更 改 一 个 参数 ， 您 就 可 以 使 用 基准 程序 来 评 
估 是 否 需 要 进行 该 更 改 。 

5. 按 级 别 测量 和 重新 配置 和 一 次 只 应 更 改 一 个 参数 的 理由 一 样 , 一 次 也 只 能 调整 系 
统 的 一 个 级 别 。 建 议 使 用 以 下 系统 级 别 列表 作为 参考 : 
便 件 
操作 系统 
应 用 服务 器 
数据 库 管 理 器 
应 用 程序 
SQL 语句 

6. 检查 是 否 存在 硬件 和 软件 问题 : 某 些 性 能 问题 可 通过 维修 硬件 或 修订 软件 来 解决 。 
如 果 这 样 可 以 解决 问题 ， 就 不 需要 花 过 多 时 间 来 监视 和 调整 系统 。 

7. 在 升级 硬件 前 搞 清 楚 问 题 : 虽然 增加 存储 器 或 提高 处 理 器 能 力 可 以 立即 改善 性 能 ， 
但 也 应 花 时 间 了 解 系 统 的 瓶 贷 所 在 。 因 为 可 能 花 钱 增加 磁盘 存储 器 后 ， 才 发 现 系统 没有 处 
理 能 力 或 没有 可 利用 它 的 通道 。 

8. 在 开始 调整 前 制定 回 退 方案 : 正如 前 面 所 讲 ， 某 些 调整 可 能 产生 意外 的 性 能 结果 。 
如 果 此 调整 使 性 能 降低 ， 应 撤销 该 调整 ， 改 试 另 一 种 调整 。 如 果 保 存 了 以 前 的 设置 并 可 重 
新 调用 它 ， 那 么 撤销 不 正确 的 调整 将 变 得 非常 容易 。 
1.6 ”性 能 调整 的 方法 和 过 程 
1.6.1 性 能 调整 的 步 又 


不 同类 型 的 应 用 程序 有 不 同 的 性 能 要 求 。 性 能 改进 过 程 可 以 通过 以 下 几 个 步骤 来 
壮 虑 。 

(1) 首先 执行 下 面 的 初始 检 碍 : 

e 获取 和 耻 接 用 户 的 使 用 反馈 ， 确 定性 能 目标 和 范围 。 

e 获取 性 能 表现 好 与 专 时 的 操作 系统 、 数 据 库 、 应 用 统计 信息 。 

e 对 数据 库 做 一 次 全 面 健康 检 奏 。 

(2) 根据 收集 到 的 信息 ， 以 及 对 应 用 特性 的 了 解 ， 构 建 性 能 概念 模型 ， 明 确 性 能 瓶颈 
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所 在 ， 以 及 导致 性 能 降低 的 根本 原因 。 

e 首先 应 该 排除 操作 系统 、 硬 件 资 源 造成 的 瓶颈 。 

e 然后 针对 数据 库 系统 性 能 进行 分 析 。 

e 必要 时 还 需要 检查 应 用 日 志 ， 因 为 系统 性 能 问题 也 有 可 能 是 由 于 应 用 非 SQL 部 分 

造成 的 瓶颈 。 

(3) 提出 一 系列 有 针对 性 的 优化 措施 ， 并 根据 它们 对 性 能 改善 的 重要 程度 排序 ， 然 后 
逐一 加 以 实施 。 不 要 一 次 执行 所 有 的 优化 措施 ， 必 须 逐 条 党 试 、 逐 步 对 比 。 

(4) 通过 获取 直接 用 户 的 反馈 ， 验 证 调整 是 否 已 经 产生 预期 的 效果 。 否 则 ， 需 要 重新 
提炼 性 能 概念 模型 ， 直 到 对 应 用 特性 的 了 解 能 更 加 准确 。 

(5) 重复 上 述 步 又 ， 直 到 性 能 达到 目标 或 由 于 客观 约束 无 法 进一步 优化 。 


1.6.2 ”性 能 调整 的 限制 


调整 仅 能 够 对 系统 的 效率 进行 一 定 程度 的 更 改 。 您 同时 还 要 考虑 需要 投入 多 少时 间 和 
灾 用 来 改善 系统 性 能 ， 以 及 圳 要 投入 多 少 额 外 的 时 间 和 费用 来 帮助 系统 的 用 户 。 

例如 ， 如 果 系 统 遇 到 性 能 瓶 了 项 ， 通 常 可 以 通过 调整 来 提高 性 能 。 如 果 已 接近 系统 的 性 
能 限制 ， 而 用 户 数 大 约 增 加 10%， 那 么 啊 应 时 间 可 能 远 远 不 止 增加 10%。 在 这 种 情况 下 ， 需 
要 确定 如 何 调整 系统 来 抵消 降低 的 性 能 。 

但 是 ， 有 一 个 临界 点 ， 超 过 这 个 临界 点 再 进行 调整 就 没有 用 了 。 达 到 该 临界 点 时 ， 应 
考虑 在 环境 的 限制 下 调整 您 的 目标 和 期 望 值 , 而 不 是 一 味 地 增加 更 多 的 CPU、 存储 和 内 存 。 


1.6.3 回 客 户 了 解 情况 


再 要 对 系统 进行 调整 的 首 个 征兆 可 能 是 用 户 提 出 的 意见 。 如 条 您 没有 足够 的 时 间 来 设 
定性 能 目标 并 通过 一 种 完备 的 方式 来 监视 和 调整 ， 可 昕 听 用 户 的 意见 。 通 常 可 提出 以 下 几 
个 简单 的 问题 ， 确 定 从 哪里 开始 僵 找 问题 。 例 如 ， 可 以 询问 用 户 : 

e 应 用 是 OLTP、OLAP、DSS 还 是 批 处 理 等 ? 

e “了 啊 应 慢 ” 达 到 何 种 程度 ?” 是 比 预期 的 慢 10% 还 是 慢 数 十 倍 ? 

e 问题 是 何 时 发 现 的 ? 它 是 最 近 出 现 的 ， 还 是 一 直 都 存在 ? 

e 其 他 用 户 有 相同 问题 吗 ? 这 些 用 户 是 一 两 个 人 还 是 整个 一 组 ? 

e 如果 是 一 组 用 户 过 到 相同 问题 ， 他 们 是 耕 与 同一 个 局 域 网 连接 ? 
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e 这 些 问 题 似乎 与 特定 事务 (例如 银行 结 县 日 、 结 复 日 等 ) 或 应 用 程序 相关 吗 ? 

e 注意 到 问题 出 现时 有 任何 规律 吗 ? 例如 ， 问 题 是 人 否 是 在 一 天 的 特定 时 间 发 生 ， 如 
上 午 刚 开始 上 班 的 时 间 ， 或 持续 的 时 间 有 多 长 ? 

e 便 件 环境 。 

e 操作 系统 版 本 和 补丁 情况 。 

e 应 用 服务 器 (WebLogic、WebSphere) 和 交易 中 间 件 (TUEXDO、CICS 和 MQ 等 )。 

e 数据库 (Oracle、DB2、Sybase 和 Informix)。 

。 SQL 语句 。 

e 应 用 开发 模式 (C/C++、Java、 艇 入 SQL 编程 、CLI、J2EE、MQ 或 CICS 等 )。 


1.6.4 性 能 调整 流程 图 


以 我 们 本 章 开 始 时 所 举 的 案例 为 例 ， 在 这 个 应 用 系统 中 ， 存 储 在 最 底层 ， 然 后 依次 是 
操作 系统 、 数 据 库 、 应 用 服务 器 和 应 用 程序 。 所 以 我 们 在 调整 的 时 候 应 该 遵循 由 下 向 上 、 
由 粗 到 细 的 原则 ， 有 具体 调整 流程 如 下 : 

(1) 检 奏 手机 银行 系统 中 所 有 人 硬件 系统 ， 特 别 是 SAN 网 络 中 的 硬件 ， 确 认 人 硬件 是 人 否 存 
在 问题 。( 存 储 IO) 

(2) 检查 SAN 交换 机 的 数据 流量 ， 观 察 是 否 存 在 通道 流量 不 对 称 、 数 据 包 丢 失 或 数据 
传输 过 程 中 校 验 错 的 问题 。( 存 储 TO) 

(3) 分 析 ESS 上 的 数据 分 布 , 利用 相关 存储 监测 软件 , 观察 是 否 存在 FC 通道 、cluster、 
HBA 卡 负 载 不 平均 的 现象 。( 存 储 LO) 

(4) 检查 CPU、 内 存 、LO 和 了 网络， 确定 是 否 存在 资源 性 能 瓶 撤 。( 操 作 系 统 ) 

(5) 监控 数据 库 运 行 ， 检 查 DB2 数据 库 的 参数 设置 是 否 合理 。( 数 据 库 ) 

(6) 监控 应 用 服务 器 ， 确 认 相 关 配 置 参 数 是 否 合理 。( 中 间 件 ) 

(7) 确定 最 影响 性 能 的 应 用 程序 ， 协 助 软件 开发 商 优化 应 用 程序 。( 应 用 程序 ) 

流程 的 前 3 个 步 又 是 存储 层面 的 。 因 为 存储 上 丙 不 同 并 且 各 目 需要 专门 的 存储 监控 软 
件 ， 而 这 超出 了 我 们 的 讨论 范围 ， 所 以 下 面 我 从 操作 系统 入 手 ， 简 单 讲 解 如 何 定 位 性 能 瓶 
人 须 并 做 出 优化 。 

当 应 用 系统 出 现 性 能 问题 时 ， 首 先 要 从 操作 系统 入 手 ， 确 定 是 硬件 故障 还 是 系统 出 现 
资源 短缺 。 操 作 系统 故障 定位 流程 图 如 图 1-4 所 示 。 


是 否 能 够 马 ] 
进入 系统 并 解 
决 资源 不 足 


是 一 一 再 \ 


登录 进入 系统 , 检查 
系统 资源 情况 (CPU、 主机 手工 切换 备 机 
内 存 ，I/0、 网络) ， 


解 幢 资源 和 不 足 问 原 


图 1-4 操作 系统 故障 定位 流程 图 


当 系 统 不 存在 人 硬件 故障 而 存在 资源 瓶 绒 时 , 可 以 参考 图 1-5(AIX) 和 图 1-6(HP-UX) 来 定 
位 资源 瓶颈 所 在 。 


图 1-5 操作 系统 (AIX) 性 能 调整 流程 图 
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图 1-6 操作 系统 (HP-UX) 性 能 调整 流程 图 


服务 器 中 主要 有 4 类 硬件 资源 : CPU、 内 存 、 和 存储、 网络。 检查 AIX 系统 性 能 状态 的 
主要 目标 是 发 现 系 统 配置 的 硬件 资源 是 否 满足 当前 应 用 负载 的 需要 ， 是 否 存在 某 一 类 型 资 
源 紧 张 从 而 成 为 整个 系统 稳定 高 效 运 行 的 瓶颈 。 定 位 出 系统 瓶颈 之 后 ， 可 以 有 针对 性 的 做 
些 调整 ， 一 些 系 统 内 核 参 数 可 以 根据 应 用 特点 做 出 调整 来 解决 部 分 性 能 问题 ， 有 些 系统 性 

能 问题 则 需要 通过 升级 硬件 或 调整 应 用 来 解决 。 

如 果 从 操作 系统 层面 判断 出 系统 存在 瓶颈 并 且 是 由 数据 库 引 起 的 ， 那 么 可 以 按 图 1-7 
所 示 的 流程 图 来 解决 。 数 据 库 的 诊断 方法 也 要 遵循 从 下 到 上 的 原则 ， 先 确定 瓶颈 点 在 什么 
地 方 ， 是 CPU、 和 磁盘 、 网 络 还 是 数据 库 内 部 的 问题 ? 然后 再 结合 数据 库 的 监控 命令 来 进 一 
步 定位 。 如 果 是 CPU 出 现 问 题 , 那么 就 要 通过 系统 监控 确认 是 USER 高 还 是 KERNEL 高 。 
如 果 是 USER 高 ， 那 么 需要 用 数据 库 命令 来 排 租 原因 如果 是 由 于 并 发 活动 太 多 造成 的 ， 
分 析 造 成 并 发 活动 太 多 的 原因 是 不 是 由 于 某 些 SQL 的 执行 计划 不 合理 造成 的 ,进而 对 SQL 
进行 调整 。 不 管 怎样 ， 调 整 通 稼 是 一 系列 开销 。 一 旦 确定 瓶颈 ， 了 避 可 能 要 牺牲 一 些 其 他 方 
面 的 指标 来 得 到 所 要 的 结果 。 例 如 ， 如 果 IO 有 问题 ， 您 可 能 需要 购买 更 多 内 存 或 磁盘 。 


第 1 章 性 能 调整 概述 


如 于 不 可 能 买 ， 那 么 可 能 要 限制 系统 的 并 发 性 以 获取 所 需 的 性 能 。 然 而 ， 如 条 您 已 经 明确 
地 定义 了 性 能 目标 ， 那 么 用 什么 开销 来 交换 忆 性 能 束 变 得 很 容易 ， 因 为 您 已经 确定 了 哪些 
方向 是 最 和 草 要 的 ， 如 果 您 的 目标 为 局 性 能 ， 那 么 就 以 空间 换取 时 间 ， 物 牲 一 些 空间 资源 来 
换取 局 性 能 。 


荆 的 要 行 计划 后 成 表 扫 表 ? 
prefetcher 数 宇 过 小 ? 


pp 3 sorthaap 过 小 ? 
Tt 太 名 的 排序 或 分 组 拘 作 ? 
总 少 率 引 ? 


锐 多 的 关联 查询 ? 旧 的 设备 驱动 ? 


杰 小 的 SQL cache? 较 备 的 Latch? 是 否 有 其 估 程 序 在 圭 搜 弄 香 1? | 
i 索引 扫 模 过 其? SE s 
本 高 的 并 发 旧 的 系 经 辣 本 ? | 女 冲 池 配 置 过 小 ? 日 志文 件 是 否 有 运程 镜像 ? 
是 否 有 频繁 的 提交 ? 
数据 表 宇 辣 日 志 缔 冲 和 配置 是 天 合适 ? 


”临时 表 室 间 
是 否 分 页 ? 
有 去 对 象 的 交互 ? 


日 志文 件 共 他 程 床 占 用 网 络 ? 


索引 表 空 间 
数据 库 性 能 问题 


图 1-7 数据库 性 能 调 优 流程 图 


随 着 应 用 越 来 越 庞 大 ， 硬 件 性 能 的 提高 ， 全 面 的 调整 逐渐 变 成 代价 高 昂 的 行为 。 在 这 
种 情况 下 ， 要 取得 最 大 的 效率 /投入 比 ， 较 好 的 办 法 是 调整 应 用 的 关键 部 分 ， 使 其 达到 比较 
局 的 性 能 ， 这 样 从 总 体 上 来 说 ， 整 个 系统 的 性 能 也 是 比较 高 的 。 这 也 束 是 有 名 的 20/80 原 
则 ， 调 整 应 用 的 20%( 关 键 部 分 )， 能 解决 80% 的 问题 。 

性 能 调整 实际 上 就 是 对 资源 的 调整 ， 通 过 资源 之 间 的 交易 达到 您 的 性 能 目标 。 例 如 ， 
要 改进 数据 库 的 IO 性 能 ， 可 以 增加 数据 库 绥 冲 池 的 大 小 。 但 更 大 的 缓冲 池 也 需要 更 多 的 
内 存 ， 这 就 可 能 影响 操作 系统 行 性 能 和 刷新 内 存 的 时 间 。 


1.7 ”性 能 模型 
如 果 将 系统 比喻 成 一 座 功 能 齐全 的 大 城市 ， 那 么 数据 库 就 是 这 座 大 城市 里 的 基础 建 


筑 ， 比 如 城市 的 街区 、 道 路 、 桥 和 染 、 房 屋 等 ， 数 据 库 构 师 束 是 这 座 大 城市 的 规划 师 ， 负 
贡 设 计 出 最 适宜 人 们 居住 的 环境 ， 交 通 作 为 城市 的 传输 通过 ， 生 接 影响 看 人 们 的 出 行 效率 
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和 生活 质量 。 差 的 数据 库 架 构 会 让 数据 库 在 大 负载 、 多 并 发 的 情况 下 变 得 运行 缓慢 ， 就 像 
糟糕 的 交通 规划 会 让 这 座 城 市 变 得 拥堵 不 堪 一 样 。 因 此 ， 如 果 在 出 现 数据 库 性 能 的 时 候 去 
考虑 改变 数据 库 架 构 设 计 ， 无 异 于 为 城市 重新 规划 道路 结构 ， 这 是 绝对 无 法 接受 的 。 

在 之 前 的 篇 幅 里 我 们 提 到 了 性 能 的 方方面面 ， 这 里 我 们 可 以 对 前 面 的 知识 作 下 归纳 ， 
抽象 出 数据 库 架 构 中 的 数据 库 性 能 模型 。 首 先 数据 库 架 构 的 目的 是 让 数据 库 运 行 够 快 、 更 
稳定 ， 同 时 有 很 强 的 线性 扩展 能 力 ， 可 以 快速 处 理 更 多 的 用 户 请 求 ， 因 此 任何 形式 的 性 能 
问题 都 可 以 归结 为 如 何在 最 低 资 源 利 用 率 的 情况 下 提高 数据 库 否 吐 量 和 降低 响应 时 间 问 
题 。 那 么 影响 数据 库 性 能 的 4 个 因素 为 CPU、 磁盘、 网络 和 内 存 。 根 据 木 桶 原理 ， 只 有 
不 断 对 这 4 个 因素 进行 优化 配置 ， 消 除 短 板 ， 才 能 最 终 达 到 增 大 吞吐 量 、 降 低 啊 应 时 间 的 
日 的 。 
数据 库 性 能 模型 为 数据 库 架 构 师 提供 了 一 套 调 优 数 据 库 性 能 的 方法 论 ， 从 宏观 上 来 
我 们 将 其 抽象 为 输入 、 处 理 和 输出 三 个 部 分 ， 如 网 1-8 所 示 。 


看 


“ 


对 应 用 进行 分 类 , 确 


响应 时 间 


痪 源 利用 率 


对 指标 进行 调整 , 确 
定数 据 库 物理 架构 


[汪汪 
Et (es ee te ,ee st st ee ts et ts et et ey se et te et et sg 
Hs a i 


MW 
Mm 


i i i i i i i i i 


图 1-8 ”数据 库 性 能 模型 
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1.7.1 输入 


输入 部 分 里 搬 述 了 数据 库 架 构 师 在 设计 融 性 能 的 数据 库 之 前 一 定 要 损 消 楚 的 一 件 事 


情 ， 即 你 的 目标 是 什么 ?这 里 有 名 话 与 大 家 分 享 一 “性 能 最 优 


的 系统 不 一 定 是 最 好 的 系 


统 "。 作 为 架构 师 ， 不 要 为 了 调 优 而 调 优 ， 只 要 系统 能 达到 应 用 的 要 求 ， 束 够 了 。 布 望 表 
1-1 中 的 4 项 输入 可 以 帮助 大 家 梳理 调 优 目标 。 


给 入 
应 用 的 基本 信息 和 使 用 场景 


应 用 的 整体 性 能 指标 


应 用 的 规模 增长 量 


应 用 的 整体 预算 


1.7 过 外 理 


表 1-1 性 能 调 优 的 输入 项 
摘 ” 述 

根据 应 用 的 基本 信息 和 使 用 场景 ， 人 确定 应 用 在 数据 库 里 的 类 型 ， 是 人 往事 
务 处 理 还 是 偏 数据 分 析 ， 是 CPU 密集 型 还 是 IO 密集 型 或 混合 型 
根据 应 用 的 整体 性 能 指标 ， 确 定 最 终 数 据 库 的 各 项 性 能 指标 ， 比 如 : 
e 各 种 缓存 命中 率 
e 读 写 LO 响应 时 间 
e 日志 读 写 速度 
e CPU 使 用 率 
e 了 癌 络 延 开 时 间 
e IOPS 的 值 
根据 应 用 的 增长 规模 ， 确 定数 据 库 如 何 适 应 未 来 的 应 用 增长 ， 比 如 : 
e 数据 量 的 增长 
e 用 户 数 的 增长 
@ 业务 的 增加 
了 解 应 用 的 整体 预算 ， 有 助 于 DBA 知道 影响 数据 库 性 能 的 硬件 瓶颈 ， 
在 软件 已 无 太 大 调整 空间 的 情况 下 ， 可 以 通过 争取 升级 人 硬件 来 达到 数据 
库 性 能 的 提升 


对 于 数据 库 以 构 师 而 言 ， 处 理 可 以 按照 两 大 顺序 执行 。 首 先 根据 应 用 场景 和 增长 规模 ， 
确定 数据 库 的 好 辑 染 构 ， 然 后 根据 各 种 指标 和 预 揽 ， 确 定数 据 库 的 物理 淋 构 。 迪 辑 淋 构 是 
用 抽 销 的 方法 拍 述 数据 库 的 架构 , 该 方法 脱离 具体 的 价 件 和 软件 , 脱离 具体 的 拉 术 和 协议 ， 
具有 很 强 的 重用 性 ， 物理 架构 则 更 多 是 从 物理 和 实现 上 看 手 ， 根 据 不 同 的 硬件 、 软 件 、 技 
术 和 协议 来 调整 数据 库 的 参数 配置 ， 是 他 辑 染 构 的 具体 实现 。 可 以 说 “过 辑 架 构 决 定 物理 
染 构 ， 物 理 染 构 文 撑 迪 辑 架 构 ”。 
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下 面 ， 我 们 先 看 一 下 数据 库 的 逻辑 架构 包括 哪些 东西 。 

也 许 你 的 系统 很 庞 杀 ， 有 很 多 的 功能 ， 要 实现 很 多 的 业务 ， 但 是 这 些 业 务 经 过 界面 、 
中 间 件 、 代 码 罗 辑 处 理 后 ， 到 达 数 据 库 的 就 只 会 是 基本 的 增 、 删 、 改 、 查 操作 ， 因 此 判断 
业务 属于 哪 种 类 型 很 简单 ， 大 并 发 、 小 数据 处 理 的 是 OLTP 系统 ， 小 并 发 、 大 数据 处 理 的 
是 OLAP 系统 ， 两 者 几 有 的 是 混合 系统 ， 不 同 的 系统 适用 不 同 的 数据 库 架 构 。 这 里 介绍 几 
种 常见 的 用 于 处 理 OLTP 和 OLAP 的 数据 库 架 构 。 

对 称 多 处理 句 (SMP) 系 统 由 同一 台 机 器 中 几 个 能 力 相 等 的 处 理 右 组 成 ， 像 磁 可 空 间 和 
内 存 这 类 资源 是 共享 的 ， 利 用 可 用 的 多 个 处 理 器 ， 可 以 更 快 地 完成 不 同 的 数据 库 操作 ， 如 
图 1-9 所 示 。 该 数据 库 系统 还 可 将 单个 查询 的 工作 分 布 在 可 用 的 处 理 器 上 以 提高 处 理 速 度 。 
其 他 数据 库 操 作 ， 例 如 装 入 数据 、 备 份 和 复原 表 空间 以 及 对 现 有 数据 创建 案 引 ， 都 可 以 利 
用 多 个 处 理 器 。 


数据 库 系 统 


图 1-9 对称 多 处 理 器 (SMP) 系 统 


用 户 请 求 通 常 是 以 线程 形式 存在 ， 在 SMP 环境 中 ， 用 户 的 请 求 通 过 系统 总 线 被 平均 
分 配 到 不 同 的 CPU 上 进行 处 理 ， 这 些 不 同 的 CPU 共享 同一 块 内 存 空间 和 磁盘 ， 线 程 之 间 
通过 信号 量 进行 通信 ， 因 此 这 种 结构 的 线程 间 通 信 的 成 本 非常 小 ， 同 时 用 户 可 以 通过 增加 
CPU、 内 和 存 或 便 盘 来 提 融 整 体 的 机 器 性 能 ， 非 常 适合 处 理 OLTP 类 型 的 应 用 。 

Sharing Nothing 染 构 (多 分 区 数据 库 ) 指 的 是 将 一 个 数据 库 分 成 多 个 多 辑 分 区 ， 每 个 风 
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各 分 区 可 以 运行 在 不 同 的 机 禹 上， 其 至 运行 在 同一 台 机 右 的 不 同 处 理 融 上 ， 每 个 逻辑 分 区 
拥有 独立 的 处 理 匿 、 内 存 空 间 、 磁 盘 空 间 和 日 坊 空间 ， 互 相 之 间 通 过 网 络 进行 通信 ， 如 疼 
1-10 所 示 。 用 尸 数 据 通过 一 定 的 规则 ， 比 如 哈 硕 或 轮 询 每， 被 分 别 存 储 到 不 同 的 数据 库 分 
区 的 磁盘 中 。 不 同 的 数据 库 分 区 之 间 不 共享 任何 资源 。 


图 1-10 Sharing Nothing 架构 (多 分 区 数据 库 ) 


在 这 种 架构 下 , 一 个 用 户 请 求 被 分 解 成 多 个 线程 ,分 派 到 不 同 的 数据 库 分 区 并 行 执行 ， 
这 些 线程 执行 结束 后 ， 通 过 网 络 将 结果 汇总 到 一 起 ， 经 过 人 处理 后 返回 给 用 户 。 用 户 可 以 根 
据 CPU 处 理 能 力 的 不 同 ， 为 数据 库 分 区 分 配 不 同 的 处 理 器 个 数 ， 做 到 每 个 CPU 都 能 充分 
运行 。 因 此 这 种 架构 决定 了 在 处 理 大 数据 量 复 洒 全 询 的 场景 下 上 其 有 非常 优秀 的 性 能 ， 相 比 
传统 的 SMP 数据 库 染 构 ， 在 OLAP 的 用 户 场 景 中 ， 拥 有 不 可 比拟 的 优势 。 但 是 由 于 通信 
网 络 的 高 延 时 和 复杂 的 预 处 理 ， 决 定 了 在 处 理 小 查询 、 大 并 发 、 增 删改 操作 时 ， 时 间 会 有 
明显 增长 ， 因 此 并 不 适合 OLTP 的 用 户 场 景 。 

然而 随 看 业务 的 发 展 ， 用 户 数 越 来 越 多 ， 那 么 能 否 将 对 称 多 人 处理 器 (SMP) 系 统 进 行 扩 
展 ， 文 持 多 人 台 不 同 的 物理 机 器 呢 ? 答案 是 肯定 的 。Share Disk( 共 享 磁 盘 ) 技 术 就 是 对 这 种 扩 
展架 构 的 实现 。 该 技术 可 以 文 持 更 大 的 在 线 并 发 处 理 ， 提 供 民 好 的 扩展 能 力 和 融 可 用 性 文 
持 ， 其 基本 结构 如 图 1-11 所 示 。 
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| 


InfiniBand&RoCE 网 络 (RDMA) 


网 络 文 件 系 统 


a 
硬盘 


图 1-11 Share Disk( 直 诗人 磁 稻 ) 技 术 


在 该 结构 下 , 一 个 数据 库 以 多 个 节点 的 形式 存在 , 每 个 节点 拥有 不 同 的 CPU 和 内 存 资 
源 ， 但 是 共享 同样 的 数据 库 磁盘 ， 这 些 节 点 在 形式 上 是 对 等 的 ， 没 有 主 仆 关 系 ， 它 们 可 以 
通过 网 络 磁盘 技术 同时 操作 数据 库 文 件 或 日 志文 件 ,不 同 节 点 之 间 通 过 InfiniBand 或 RoCE 
网 络 的 远程 下 接 内 存 读 写 (RDMA) 技 术 实现 数据 在 内 存 中 的 二 接 读 写 ， 最 大 限度 地 避免 了 
网 络 延 时 。 由 于 各 个 节点 是 对 等 关系 并 且 没 有 任何 持久 化 的 资源 ， 因 此 添加 节点 以 实现 线 
性 扩展 将 变 得 非常 容易 ， 同 时 任何 一 个 节点 的 宕 机 故障 也 不 会 影响 整个 数据 库 系统 的 可 
用 性 。 

由 于 篇 幅 有 限 ， 数 据 库 逻辑 架构 我 们 就 先 谈 到 这 里 ， 就 不 再 详细 展开 了 ， 下 面 我 们 再 
来 谈 一 谈 数据 库 的 物理 架构 。 要 想 做 好 数据 库 物 理 架 构 ， 需 要 掌握 下 面 几 点 : 
测 握 物理 架构 的 方法 论 。 


各 

e 学 握 数 据 库 的 性 能 指标 。 
e 午 握 数据 库 的 实现 原理 。 
e 测 握 各 种 调 优 方法 。 


束 数 据 库 物理 设计 的 方法 论 而 言 ， 有 下 和 面 4 种 方法 。 


20 


方法 1: 根据 数据 库 逻 辑 设 计 ， 找 到 相应 数据 库 产品 的 实现 方法 
对 于 同一 套数 据 库 逻 辑 设 计 ， 不 同 的 数据 库 产品 有 个 同 的 实现 方法 ， 表 1-2 列 出 了 不 
同 数 据 库 产品 的 实现 技术 。 


表 1-2 不同 逻辑 淋 构 的 实现 技术 


逻辑 染 构 实现 技术 
对 称 多 处理 疾 (SMP) 基本 所 有 商业 数据 库 都 支持 
Sharing Nothing 染 构 (多 分 区 数据 库 ) DB2 DPF、 TeraData、Greenplum、Netezza 
Share Disk 架构 (共享 磁盘 ) DB2 pureScale、Oracle RAC 


方法 2: 合理 设计 数据 库 对 象 

数据 库 对 象 是 数据 库 的 逻辑 概念 ， 其 设计 的 好 坏 除 了 决定 系统 功能 外 ， 有 时 还 会 决定 
系统 的 性 能 ， 其 设计 主要 包括 模型 的 设计 、 表 类 型 的 选择 、 索 引 的 设计 、 分 区 的 设计 、 表 
空间 的 设计 等 。 

在 模型 的 设计 上 ， 我 们 通 第 采用 第 三 范式 来 进行 数据 库 对 象 的 模型 设计 ， 但 是 有 时 为 
本 性 能 考虑 ， 我 们 通常 会 做 一 些 退 化 ， 比 如 设计 一 些 见 余 字 段 或 者 将 多 表 合 并 来 加 快 系统 
的 查询 性 能 。 例 如 对 于 有 大 量 数 据 的 销售 流水 表 ， 完 全 按照 第 三 范式 来 做 的 话 会 有 一 个 外 
键 关联 客户 信息 ， 一 个 外 键 关联 产品 信息 。 但 是 如 果 系 统 在 运行 一 段 时 间 后 ， 这 三 张 表 的 
数据 变 得 非常 多 ， 那 么 连接 查询 的 性 能 将 会 变 得 很 差 ， 我 们 通常 的 做 法 是 再 设计 一 张 横 问 
表 ， 将 客户 信息 和 产品 信息 全 都 放 到 销售 流水 表 里 ， 这 样 就 避免 了 关联 查询 。 


CUSTOMER'S 


SALES ID 
AMOUNT 
TIME 
CUST_ID 
FRIL | PROD TID 


CUST NAME 
GENDER 

AGE 

PROD _ID 

PROD NAME 
PROD CATEGORY 


PROD_ID 
PROD NAME 
PROD CATEGORY 


图 1-12 第 三 范式 图 1-13 T SALES 横向 表 


表 通 党 分 为 很 多 种 ， 除 了 基本 表 外 ， 还 有 临时 表 、 多 维 表 、 分 区 表 、 范 围 集群 表 、 物 
化 视图 表 等 。 不 同 的 表 有 不 同 的 用 途 ， 如 果 销 误 使 用 的 话 ， 也 会 对 性 能 有 比较 大 的 影 啊 。 
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比如 在 不 需要 物化 视图 的 地 方 使 用 物化 视图 表 ， 就 会 对 源 表 的 增删 改 性 能 造成 影响 。 

合理 使 用 正确 的 索引 是 提高 系统 执行 效率 的 关键 因素 ， 对 索引 的 使 用 需要 注意 以 下 一 
些 问 题 : 

1) 注意 LIKE 运算 符 。 

2) 注意 NULL 值 。 

3) 优化 复合 索引 。 

4) 注意 索引 的 相关 参数 。 

5) 注意 索引 与 谓词 的 关系 。 

6) 根据 得 询 使 用 的 列 建立 索引 。 

7) 根据 条 件 语 句 中 谓词 的 选择 度 创建 索引 。 

8) 避免 在 建 有 索引 的 列 上 使 用 函数 。 

9) 在 那些 需要 被 排序 的 列 上 创建 索引 。 

10) 合理 使 用 include 关键 词 创建 索引 。 

11) 指定 索引 的 排序 属性 。 

玫 据 话 的 页 天 小 也 是 在 级 据 话 放 放 的 时 候 就 庆 该 确定 的 ， 售 则 一 旦 实施 就 很 难 更 改 。 
对 于 执行 随机 行 谈 与 操作 的 OLTP 应 用 程序 , 通常 最 好 使 用 较 小 的 页 大 小 ， 这 样 不 需要 的 
行 滔 费 的 缓冲 池 衬 间 束 会 较 少 。 对 于 一 次 访问 大 量 连续 行 的 OLAP 应 用 程序 ， 页 大 小 大 一 
些 会 比较 好 ， 这 样 束 能 减少 读 取 特定 数目 的 行 所 需 的 IO 请 求 数 ， 更 大 的 页 大 小 也 可 以 允 
许 您 减少 索引 中 的 级 别 数 。 总 之 ， 在 满足 以 上 条 件 的 情况 下 ， 交 易 系 统 使 用 较 小 的 页 更 适 
合 ， 仓 储 系 统 使 用 较 大 的 页 更 适合 。 

对 于 表 空 间 的 选择 ， 通 彰 的 数据 库 都 会 包含 系统 管理 的 表 空 间 和 数据 库 管理 的 表 空 间 
两 种 类 型 。 系 统管 理 的 表 空 间 由 操作 系统 的 文件 系统 管理 需 分 配 和 管理 空间 ， 管 理 灵活 但 
是 性 能 很 震 。 数 据 库 管 理 的 表 衬 间 由 数据 库 管 理 程序 控制 存储 空间 ， 表 空间 容 需 可 使 用 文 
件 系 统 或 窜 设 备 ， 虽 然 管理 复杂 ， 但 是 在 性 能 上 会 有 很 大 的 提升 。 


方法 3: 合理 设计 存储 

磁 副 作为 数据 库 的 最 底层 ， 从 发 明 至 今 ， 依 然 没 有 摆脱 机 械 设 备 固 有 的 速度 限制 ， 面 
ES CPU 和 内 存 ， 存储 在 很 多 情况 下 依然 是 系统 的 最 终 瓶颈 ， 因此 作 
为 数据 库 架 构 师 ， 必 须 很 好 地 规划 存储 。 一 般 存 储 规划 应 该 从 下 和 面 几 个 方面 进行 : 

(1) 磁盘 LO 的 吞吐 量 (每 秒 WO 数 IOPS 和 每 秒 传输 的 数据 量 MPS)。 

对 于 磁盘 密集 型 的 系统 ， 磁 盘 IOPS 和 MPS 指标 尤为 重要 ， 一 次 IO 指 的 是 磁盘 在 
没有 换 道 的 情况 下 产生 读 写 的 操作 ， 通 常 一 块 15 000 转 的 SAS 盘 的 IOPS 能 在 150-175 
之 间 ， 对 于 大 并 发 的 系统 ， 我 们 应 该 充分 估计 系统 峰值 的 IOPS 数 和 MPS 数 ， 采 用 合适 的 
RAID 技术 和 磁盘 数量 ， 以 防止 出 现 CPU IO Wait 高 的 情况 。 对 于 平均 负载 来 说 ， 通 常 建 


议 10 到 20 块 盘 对 应 一 个 CPU 的 Core。 

(2) 存储 的 容量 规划 。 

SATA、SAS、 光 纤 盘 ， 不 同 的 盘 具 有 不 同 的 容量 、 速 度 和 价格 ， 如 何平 衡 容 量 、 速 度 
和 价格 之 间 的 关系 也 是 前 期 数据 库 物理 设计 应 该 注意 的 问题 。 

(3) 独立 磁盘 记录 日 忘 。 

数据 库 为 了 保证 数据 的 一 任性 ， 在 进行 事务 提交 的 时 候 ， 必 须要 等 到 数据 库 日 志 写 入 
位 盘 才 算 提交 成 功 。 如 果 日 忘 写 入 绥 慢 的 话 ， 会 造成 数据 库 的 所 有 事务 提交 绥 慢 ， 因 此 数 
据 库 日 志 最 好 采用 独立 的 磁盘 来 单独 存放 ， 以 免 产 生 数 据 库 整体 的 性 能 瓶 须 。 

(4) 条 市 化 。 

为 了 能 够 协调 多 块 磁 盘 同 时 啊 应 用 户 请 求 ， 数 据 库 架 构 师 应 该 考虑 如 何在 多 块 磁 盘 间 
做 条 带 化 处 理 , 通常 的 存储 都 已 经 支持 RAID0~5 和 一 些 互相 结合 的 条 带 化 技术 。 条 带 的 深 
度 和 宽度 也 应 该 和 数据 库 的 扩展 块 大 小 进行 合理 匹配 。 


方法 4: 优化 数据 库 参 数 ， 减 少 资源 竞争 

最 后 一 点 是 优化 配置 数据 库 参 数 ， 包 括 各 种 缓存 池 的 大 小 、 内 存 区 的 配置 、 刷 新 脏 页 
的 策略 、 锁 的 策略 等 。 虽 然 各 个 数据 库 都 不 相同 ， 但 是 所 有 的 出 发 点 都 是 为 了 通过 数据 库 
参数 ， 降 低 物理 读 的 次 数 和 发 生 资源 竞争 的 可 能 性 。 这 里 就 不 再 详细 介绍 了 。 


1.7.3 输出 


通过 上 面 的 处 理 ， 您 的 数据 库 应 该 有 了 很 大 的 提高 ， 那 么 赶 又 将 调 优 后 的 数据 库 指 标 
记录 下 来 ， 发 给 项 目 组 做 最 终 的 性 能 评审 吧 。 这 里 总 结 了 一 些 应 该 关注 的 性 能 指标 ， 请 大 
家 按照 需要 补 苑 。 

1) 执行 次 数 最 多 的 SQL 的 平均 执行 时 间 。 

2) 耗 时 最 长 的 SQL 的 平均 执行 时 间 。 

3) 数据 库 的 平均 CPU 利用 率 。 

4) CPU 的 执行 时 间 、IO 等 待 时 间 和 锁 等 待 时 间 。 

5) 平均 IO 啊 应 时 间 。 

6) 支持 的 峰值 IOPS 数 和 MPS 数 。 

7) 物理 恋 和 逻辑 读 的 百分比 。 

8) 有 效 索 引 读 的 百分比 。 

9) 有 效 行 读 的 百分比 。 
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1.8 本章 小 结 


如 果 想 让 您 的 系统 保持 民 好 的 性 能 , 根据 作者 的 调 优 经 验 , 感觉 除了 DB2 目 喘 的 bug、 
补丁 和 产品 缺陷 (这 需要 IBM 原矿 商 提 供 ) 外 ， 您 需要 做 以 下 几 个 方面 的 工作 : 

1. 有 足够 的 物理 资源 并 且 能 合理 地 使 用 。 如 果 系 统 配 置 充足 的 CPU、 内 存 、 高 速 硬 
策 ， 并 且 有 足够 的 网 络 带宽 ， 那 么 这 个 系统 就 可 以 很 好 地 保证 我 们 应 用 的 系统 。 同 时 ， 在 
物理 资源 一 定 的 情况 下 , 如 何 合理 使 用 它们 也 是 性 能 调整 的 一 个 方面 。 例 如 , 使 用 异步 IO、 
使 用 裸 设 备 和 使 用 并 发 IO(CIO) 等 。 关 于 这 部 分 的 详细 内 容 ， 人 参见 本 书 第 2 章 。 

2. 良好 的 存储 WO 设计 。 必 须 有 足够 的 磁盘 设备 来 确保 充分 的 IO 并 行 性 ， 以 支持 
大 容量 的 并 发 事务 。 对 于 中 等 工作 负载 而 言 ， 每 个 CPU 全 少 应 当 有 5 到 10 个 磁盘 ， 对 于 
高 /O OLTP 工作 负载 而 言 ， 至 少 要 有 20 个 磁盘 。 操 作 系 统 (包括 交换 空间 )、DB2 日 志 
和 DB2 表 空 间 应 当 拥 有 各 自 的 专用 磁盘 。 应 当 有 多 个 磁盘 用 于 DB2 日 志 、 表 和 索引 。 

估计 良好 性 能 所 需 的 IO 处 理 能 力 的 正确 方式 ， 实 际 上 是 制作 事务 原型 并 找 出 每 个 事 
务 震 要 多 少 IJO， 以 及 每 秒 需 要 处 理 多 少 事务 。 然 后 找 出 磁盘 控制 器 和 磁盘 子 系统 的 IO 速 
率 ， 以 帮助 确定 需要 多 少 探 制 器 和 磁盘 。 关 于 这 部 分 的 详细 内 容 ， 参 见 本 书 第 2 章 。 

3. 合理 的 数据 库 配置 参数 。 数 据 库 配置 参数 影响 数据 库 资 源 的 分 配 ,合理 的 数据 库 配 


参见 本 书 第 4 章 。 

4. 为 表 创 建 最 合理 的 索引 。 确 保 查 询 中 进行 连接 操作 的 列 都 有 索引 。 如 果 为 ORDER 
BY 和 GROUP BY 涉及 的 列 建 立 了 索引 ， 那 么 就 可 以 提高 性 能 。 也 可 以 将 经 党 被 访问 的 数 
据 作 为 INCLUDE 子 句 中 的 列 包 含 在 索引 中 ,根据 所 使 用 的 表 和 SQL 语句 ,使 用 索引 顾问 
程序 Index Advisor( 也 称 索引 问 导 ，Index Wizard) 创 建 一 组 合适 的 索引 。 确 保 使 用 合适 的 过 
引 ， 从 而 在 选择 和 连接 (join) 表 时 ， 将 必须 在 内 部 访 存 的 行 数 减 到 最 少 。 关 于 这 部 分 内 容 ， 
参见 本 书 第 6 草 。 

s. 确保 应 用 程序 持 有 锁 的 时 间 尽 可 能 短 。 当 用 户 操作 涉及 多 个 交互 时 ， 每 个 交互 应 当 
提交 目 己 的 事务 并 在 将 活动 返回 给 用 户 之 前 释放 所 有 人 锁 。 通 过 尽 可 能 晚 地 局 动 事务 的 第 一 
条 SQL 语句 (可 以 司 动 事务 ) 并 使 事务 的 更 新 ( 插 入 、 更 新 和 删除 ， 这 些 操作 要 用 到 互 斥 锁 ) 
尽 可 能 接近 提交 阶段 ， 使 得 事务 的 持续 时 间 尽 可 能 地 短 。 减 少 锁 等 待 、 锁 升级 和 和 死 锁 ， 可 
以 提高 并 发 性 能 。 关 于 这 部 分 内 容 ， 参 见 本 书 第 $ 章 。 

6. 高 效 地 使 用 SQL 语句 。 通 党， 如 果 一 条 SQL 语句 能 完成 任务 ， 就 不 必 使 用 多 条 
SQL 语句 。 当 通过 在 查询 中 设置 更 多 谓词 来 提供 更 详细 搜索 条 件 时 ， 优 化 器 了 台 有 机 会 做 出 
更 好 的 选择 。 您 还 应 该 使 查询 具有 可 选择 性 ， 这 样 数 据 库 就 不 会 返回 您 不 需要 的 行 和 列 。 


例如 ， 使 用 SQL 来 过 滤 您 想 要 的 行 ; 不 用 返回 所 有 行 ， 然后 要 求 应 用 程序 执行 过 滤 操 作 。 
关于 这 部 分 内 容 ， 参 见 本 书 第 9 章 。 

7. 分 析 SQL 执行 计划 。 分 析 一 条 SQL 语句 的 执行 计划 可 以 帮 我 们 找 出 该 SQL 语句 
的 运行 瓶 倾 并 做 出 调整 , 可 以 使 用 db2exfimt 和 db2expln 来 分 析 每 一 条 SQL 语句 。 关 于 本 
部 分 内 容 ， 请 参见 第 9 章 。 

8. 数据 库 的 物理 和 逻辑 设计 。 利 用 最 合理 的 数据 库 技术 来 满足 业务 罗 辑 设计 ， 例 如 表 
分 区 、 数 据 库 分 区 、MDC( 多 维 群 集 )、 物 化 查询 表 、 表 压缩 和 XML 等 先进 的 数据 库 技术 。 
在 设计 业务 系统 时 ， 一 定 要 用 最 合理 的 数据 库 技 术 来 实现 我 们 的 业务 逻辑， 民 好 而 合理 的 
设计 往往 是 整个 系统 高 效 运 行 的 必要 条 件 。 

9. 统计 信息 更 新 、 碎 片 整理 。 必 须 定 期 更 新 统计 信息 ， 以 使 优化 器 时 刻 为 SQL 制定 
最 合理 的 执行 计划 。 同 时 ， 也 应 该 定期 对 频 震 插入、 删除 的 表 做 雁 搬 整理 以 提高 性 能 。 关 
于 这 部 分 内 容 ， 参 见 本 书 第 8 章 。 

10. 了 解 DB2 优化 器 的 工作 原理 。 优 化 器 是 DB2 数据 库 的 心脏 和 灵 瑰 了 解 它 的 工 
作 机 制 和 组 件 可 以 使 我 们 更 好 地 使 用 它 ， 从 而 为 我 们 制订 更 合理 的 访问 方案 。 关 于 这 部 分 
内 容 ， 参 见 本 书 第 7 章 。 
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操作 系统 及 存储 的 性 能 调 优 


在 第 1 革 ， 我 们 从 了 一 个 茶 银行 手机 银行 系统 的 例子 ， 该 系统 比较 复 末 ， 那 么 我 们 来 
看 看 该 系统 的 整体 VO 流动 图 ， 看 一 下 业务 访问 的 整个 过 程 ， 如 图 2-1 所 示 。 


图 2-1 IO 流动 图 (a) 


28 


DB2 数据 库 性 能 调整 和 优化 (第 3 版 ) 


图 2-1 LO 流动 图 (b) 


图 2-1 展示 了 该 行 手 机 银行 系统 的 数据 处 理 层次 图 。 在 这 个 数据 处 理 层次 图 中 ， 我 们 
可 以 站 先 简 单 地 将 其 划分 为 三 个 较 大 的 层次 : 用 户 层 、 应 用 层 、 数 据 层 。 

e 用 户 层 : 用 户 负 贡 发 出 对 数据 的 请 来 。 

e 应 用 层 : 提供 各 种 满足 要 求 的 应 用 ， 将 用 户 的 请 求 同 数 据 层 传递 ， 同 样 负 贡 将 数 

据 层 获得 的 数据 处 理 后 发 送 给 用 户 。 

e 数据 层 : 负责 数据 的 管理 以 及 最 终 的 数据 VO。 

对 于 性 能 的 问题 ， 应 用 层 和 数据 层 都 需要 引起 我 们 的 天 注 ， 这 两 者 都 会 对 整个 系统 的 
性 能 产生 较 大 的 影响 。 

假设 最 终 用 户 在 前 台 发 出 了 一 个 得 询 事 务 ， 该 事务 其 实 束 是 一 条 select 语句 ， 那 么 该 
请 求 通过 http/https 发 送 到 Web Server 服务 器 ，Web Server 接收 到 该 请 求 后 再 把 该 请 求 转发 
给 Application Server， 在 这 个 阶段 我 们 要 确保 Web Server 方面 不 存在 瓶颈 ， 人 否则 它 无 法 及 
时 地 把 最 终 用 户 请 求 转 发 ， 会 引起 事务 请 求 阻塞 ，Application Server 接收 到 请 求 后 ， 通 过 
应 用 程序 业务 馆 辑 去 数据 库 中 检索 记录 ， 在 该 阶段 ， 我 们 要 确 剑 Application Server 不 存在 
颜 饭 ， 不 会 阻 大 到 数据 库 的 请 求 ， 人 否则 我 们 要 进行 Application Server 调 优 : 当 这 个 请 求 到 
达 DB Server 后 ， 数 据 库 优化 器 会 为 该 SQL 语句 进行 语法 检查 、 语 义 分 析 、 权 限 检 查 、 醒 
询 重 写 等 ， 之 后 会 制订 最 优 的 访问 计划 (access plan)， 在 该 计划 中 决定 用 什么 索引 、 用 什么 
扫 插 方式 、 访 回 表 的 顺序 和 连接 方式 等 。 假设 优化 右 为 这 条 SQL 语句 确定 的 是 全 表 扫 拍 方 
式 ， 那 么 它 首 先 判 断 数据 库 bufferpool 中 是 侣 有 它 请 求 的 数据 ， 如 末 有 ， 束 直接 从 内 存 庶 
取 ， 这 叫 馆 辑 谈 ; 否则 丈 要 从 硬盘 谈 ， 那 么 要 首先 判断 该 表 在 哪个 表 衬 间 中 ， 如 果 该 表 衬 
间 采 用 的 是 裸 设备 ， 那 么 它 会 去 读 逻 辑 卷 (Iv)， 逻 辑 卷 是 在 逻辑 卷 管理 器 (Ivm) 之 上 的 ， 而 
lvm 又 在 操作 系统 之 上 ; 在 操作 系统 和 存储 之 间 往 往 还 会 有 存储 的 多 路 径 通 道 软 件 ( 例 如 
AI 上 的 MP IO Driver、EMC 的 power path、 日 立 的 HiCommand Dynamic Link 
Manager(HDLM) 等 ), 可 以 实现 动态 负载 均衡 和 流量 控制 ; 在 多 路 径 通道 软件 之 下 是 存储 供 
应 商 的 设备 驱动 (Device Driver); 主机 服务 右 通 过 HBA 卡 和 光纤 交换 机 连接 ， 光 纤 交 换 机 
和 存储 的 前 问 连 接 ， 存 储 的 前 病 再 通过 存储 的 Cache 连接 后 冰 的 物理 磁盘 。 这 束 是 一 次 磁 
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熏 LO 的 处 理 过 程 。 在 上 面 的 IO 流动 中 ， 每 个 环节 都 有 可 能 出 现 性 能 问题 ,所 以 大 家 要 

能 够 理解 这 个 WO 过 程 ， 在 出 现 性 能 问题 时 ， 能 快速 地 找 出 是 哪个 环节 引起 了 性 能 瓶 贷 。 
在 本 章 中 , 我 们 将 重点 介绍 数据 库 层 以 下 的 性 能 调 优 , 即 操作 系统 和 存储 的 性 能 调 优 。 

首先 给 大 家 介绍 如 何在 操作 系统 (ADJ 上 通过 性 能 监控 工具 来 定位 资源 的 瓶颈 , 以 及 如 何 合 

理 地 采用 操作 系统 的 相关 技术 (限于 篇 幅 主 要 讲解 AIX 操作 系统 ) 来 提 癌 性 能 ;然后 绸 介绍 

一 下 存储 的 相关 概念 、 存 储 VO 的 设计 以 及 如 何 合理 地 采用 存储 的 相关 技术 来 提高 性 能 。 
本 章 主要 内 容 包括 : 
e AIX 性 能 监控 综述 

操作 系统 性 能 优化 

逻辑 卷 和 lvmo 优化 

操作 系统 性 能 调整 总 结 

存储 WO 设计 

存储 基本 概念 

存储 架构 

恨 好 存储 规划 的 目标 

民 好 存储 规划 的 设计 原则 

存储 相关 性 能 调整 案例 

存储 VO 性 能 调整 总 结 


2.1 AIX 性 能 监控 绽 述 


AIX 操作 系统 中 同样 也 有 4 类 可 能 的 资源 瓶颈 : CPU、 内存、 存储 、 网 络 。 检 查 AIX 
系统 性 能 状态 的 主要 目标 是 发 现 系统 配置 的 硬件 资源 是 否 满足 当前 应 用 负载 的 需要 ， 是 否 
存在 某 一 类 型 资源 紧张 ， 从 而 成 为 整个 系统 稳定 高 效 运行 的 瓶颈 。 和 定位 出 系统 瓶颈 之 后 可 
以 有 针对 性 地 进行 调 优 ， 同 时 可 以 根据 应 用 特点 对 一 些 系统 内 核 参数 进行 调整 以 解决 部 分 
性 能 问题 ， 有 些 系统 性 能 问题 则 需要 通过 升级 硬件 或 调整 应 用 本 喘 才 能 解决 。 


2.1.1 监控 工具 


AIX 操作 系统 提供 了 丰 军 的 命令 工具 来 检 可 系统 性 能 状态 ， 其 中 最 重要 的 命令 是 
topas， 它 提供 了 实时 系统 的 主要 人 硬件 资源 运行 状态 的 监 探 界面。 在 topas 监控 界面 中 ， 通 
过 切换 不 同 的 视图 可 以 详细 显示 茶 一 特定 资源 的 运行 状态 。 分 析 topas 提供 的 实时 监控 数 


据 ， 可 以 判断 出 当前 系统 上 有 是否 有 性 能 问题 ， 以 及 造成 性 能 瓶 祷 的 硬件 资源 ， 然 后 利用 系 
统 提 供 的 其 他 工具 有 针对 性 地 分 析 菏 闫 便 件 资 源 的 运行 状态 。 
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检查 CPU 状态 的 命令 有 sar、vmstat 和 tprof。 
检查 内 存 状态 的 命令 有 vmstat、lsps、ipcs、Pps 和 svmon。 
检查 存储 状态 的 命令 有 iostat、df 和 dd。 

检查 网 络 状 态 的 命令 有 netstat。 


2.1.2 ”监控 系统 总 体 运 行 状态 


首先 从 topas 命令 入 手 来 租 看 系统 是 否 运 行 状 态 展 好， 是 售 存 在 性 能 问题 。 局 动 topas 
监控 界面 ， 如 网 2-2 所 示 。topas 默认 的 刷新 间隔 为 2 秒 ， 使 用 topas -1 <n> 命 令 可 以 更 改 刷 
新 间隔 为 n 秒 。 


Topas Monitor for host: ARAPPSQ EVENTS/ QUEUES FILE/TTY 

Wed Oct 10 10:31:31 2012 Interval: 2 Cswitch 342 Readch 266 
syscall 1507 Writech 8509 

CPU User% Kern% Wait% Idle®% Reads Rawin 0 

ALL 0.1 0_.2 0. 0 99.8 Writes Ttyout 266 
Forks lgxets 

Network KBPS I-Pack 0-Pack KB—In KB-Out FExecs Namei 

Total 4. 0 20.9 9. 0 oa 1.8 Rungueue 0. Dirblk 
Waitqueue 0. 

Disk Busy% TPS KB-—Read KB—Writ MEMORY 

Total 0. 0 0. 0 0.0 0.0 PAGING Real ,MB 31488 
Faults % Comp 41 

FileSystem TPS 及 了 一 Read KB-—Writ Steals % Noncomp 29 

Total 4. 0 0. 3 7.8 Pgxspln % Client 29 

PgsbpUut 

Owner Pageln 

arapdb PageOut Size,MB 32768 

root 51os % Used 0 

root % Free 100 

webloric NFS (calls/sec) 

root SerV2 0 WPAR Activ 0 

root CliV2 0 WPAR Total 0 

root SerV3 0 Press: "h"—help 

root CliV3 0 "q"—gquit 

root 

arapdb 

十 DO 七 

root 

roOOt 

root 

roOt 

root 

root 


图 2-2 topas 监控 界面 


在 topas 监控 界面 的 左上 有 角 可 以 观察 到 操作 系统 的 主机 名 、 当 前 系统 时 间 和 监控 数据 
刷 狐 间隔 。 

然后 依次 观察 CPU、 内 存 、IO、 网 络 的 运行 状态 。 图 2-3 中 的 框 选 部 分 为 CPU 的 性 
能 状态 数据 。 


Name PID 
db2sysc 450754 
dtgreet 155678 
XEC 45078 
Java 115054 
topas 143806 
gil 25156 
swapbppbper 4384 
swapper 4920 
swabpbper 4692 
db2fmp 107264 
python 62140 
sshd 147868 
rpc. lock 82928 
站 50050 
sendmail 65772 
db2fmcd 475632 
topas nm 254426 


my 


一 = 一 一 = 一 一 


PAGING SPACE 


四 一 | 

9 
"CN 

村 


TT 


ocoPooooooooPoPooPoroY 
mE 
se] 
= 


CT 


Hs 
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Topas Monitor for host: ARAPPSQ EVENTS/QUEUES FILE/TTY 

Wed Oct 10 10:36:09 2012 Interval: 2 Cswitch 401 Readch 953. OK 
syscall 2993 Writech B8288 
Reads 236 Rawin 0 
Writes 6 Ttyout 82 

1 eets 0 

2 Namei 

0 Dirblk 

0 


| 
|# || Forks 
| 


| ## 提 林村 村 打 打 提 柑 村 林 林 打 并 并 宁 林 并 并 林村 提 林 林 提 并 ## | | Execs 
Rungueue 


Network KBPS J-Pack 0-Pack KB-Jn KB-Out VWaitqueue 
Total 10. 4 90. 5 83. 0 5 二 5.0 MEMORY 


图 2-3 CPU 性 能 状态 数据 


0. 
0. 


CPU 资源 被 划分 成 Kernel、User、Wait、Idle 4 个 部 分 : Kernel 和 User 部 分 分 别 表示 
CPU 资源 用 于 Kernel 模式 和 用 户 模 式 的 两 种 CPU 运算 时 间 , 在 CPU 窜 忙 的 情况 下 主要 会 
表现 为 这 两 部 分 的 占 比较 高 Wait 部 分 表示 CPU 在 等 竺 存储 或 网 络 资源 ， 此 部 分 持续 较 
高 表示 系统 存储 或 网 络 资源 存在 上 瓶颈; Idqle 部 分 反映 CPU 资源 空闲 的 比例 ， 当 Idle 部 分 数 
值 接近 0 时 表示 系统 CPU 很 繁忙 ， 系统 CPU 资源 不 足 , 这 时 可 以 参考 2.1.3 节 内 容 来 进 一 
步 分 析 CPU 资源 的 使 用 情况 。 

图 2-3 右 侧 部 分 的 Runqueue 表示 位 于 等 待 CPU 资源 的 队列 中 的 线程 数 ， 但 这 是 一 个 
全 局 的 值 , 而 实际 在 操作 系统 中 每 个 CPU 都 有 一 个 运行 队列 , 因此 在 评估 此 值 时 需要 除 以 
操作 系统 中 CPU 的 数量 ， 而 当 得 到 的 结果 如 果 持 续 大 于 1 时 ， 通 常 表示 CPU 资源 不 足 。 
Waitqueue 表示 已 获得 CPU 资源 但 再 要 等 待 IO 资源 的 线程 数 ， 当 Waitqueue 的 数值 持续 
大 于 1 时 , 通常 表示 DO 资源 不 足 。 在 一 个 没有 性 能 问题 的 系统 中 ,Runqueue 和 Waitqueue 
的 值 通常 为 0， 它 们 偶尔 出 现 不 为 0 的 数值 并 不 代表 系统 存在 性 能 问题 。 

图 2-4 中 的 框 选 部 分 为 内 存 状态 数据 。 


Network KBPS Il-Pack 0O-Pack KB-ln KB-Out 
Total 号 -了 18.9 8.9 2-.1 1.6 


Disk Busy% TPS KB-Read KB-Writ 下 XN 
Total 0.0 E 0. 0 0.0 0.0 ISteal. Noncomp 29 


' Client 29 
FileSystem s TPS KB-Read KB-—Writ 
Total .9 4.0 0.1 1.1 


NFS (calls/sec) 


图 2-4 内存 状态 数据 


当 PAGING 部 分 的 PgspIn 和 PgspOut 项 持续 不 为 0 时 ,表示 系统 在 不 停 地 做 page out( 换 
页 ) 操 作 ， 这 是 系统 物理 内 存 资源 不 足 的 重要 标志 ， 这 时 可 以 参考 2.1.4 节 来 进一步 分 析 物 
理 内 存 资 源 的 分 配 和 使 用 情况 。 

在 MEMORY 部 分 可 以 看 到 系统 配置 的 物理 内 存 总 数 ， 当 前 系统 使 用 物理 内 存 用 于 计 
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算 内 存 和 文件 缓存 部 分 的 比例 ， 当 系统 物理 内 存 资 源 紧 张 时 ， 可 以 观察 到 %Comp 和 
%Noncomp 的 数值 之 和 接近 100%, 使 用 公式 100% - %Comp - %Noncomp 可 以 获得 宇 闲 物 
理 内 存 的 比例 ， 此 公式 的 计算 结果 如 果 很 低 ， 就 表示 物理 内 存 是 不 足 的 。 

在 PAGING SPACE 部 分 可 以 看 到 系统 配置 的 全 部 换 页 空间 的 容量 , 当前 已 使 用 的 与 衬 
朵 的 换 页 空间 的 比例 ， 在 物理 内 存 充 容 的 系统 上 ， 换 页 空间 的 使 用 比例 应 接近 于 0。 对 于 
换 页 空间 的 空 亲 比例 较 小 的 系统 ， 需 要 扩展 换 页 空间 的 容量 ， 同 时 也 表示 物理 内 存 资 源 
么 张 ， 应 当局 动 内 存 瓶 锋 的 分 析 。 

图 2-5 中 的 框 选 部 分 显示 了 存储 系统 状态 数据 。 


Tobas Monitor for host: ARAPPSQ EVENTS/QUEUES FILE/TTY 
Wed Oct 10 10:58:03 2012 lnterval: Cswitch 803 Readch 79980 
Syscall 2114 Writech 2289. 6K 
Kernel 0. 4 | # Reads 39 Rawin 0 
User 0.2 | # Writes ll2 Ttyout 133 
Nait 37 | 和 | Forks 3 Jgets 0 
Idle 95. 了 | 提 排 提 井 划 提 间 间 提 拓 并 提 提 提 并 并 间 间 振 提 井 并 间 提 并 并 术 | Execs 2 Namei 44 
Rungqgtete 0.0 Dirblk 0 
Network KBPS I-Pack 0-Pack KB-In KB-Out 
Total 14.0 117. 1 114. 1 7. 2 6.8 MEMORY 
PAGING Real ,MB 31488 
KBPS TPS KB-Read KB-—Writ| Faults 423 % Comp 41 
100.0 5027.1 335.0 63.7 4963.3| Steals 0 % Noncomp 29 
Pgspln 0 % Client 29 
KBPS TPS KB-Read KB-—Writ| PgspOut 
2.3K 139.5 78.1 2. 2K Pageln 11 PAGING SPACE 
Page0ut 4 Size,MB 32768 
S10S 16 % Used 0 
% Free 100 


NFS (calls/sec) 


当 Disk 的 Busy% 列 持续 接近 100% 时 ， 表 示 当 前 系统 可 能 存在 VO 资源 瓶 贷 ， 但 是 此 
指标 不 能 作为 判断 的 唯一 标准 ,还 需要 通过 KBPS、TPS 等 指标 来 综合 判断 。KBPS 代表 磁 
盘 的 吞吐 量 ， 也 就 是 每 秒 磁盘 IO 的 流量 ， 即 磁盘 每 秒 钟 读 写 数据 的 大 小 。TPS 这 个 指标 
尤其 重要 ， 它 对 应 的 是 IOPS， 即 IO Per Second， 也 就 是 每 秒 进行 读 写 (UVO) 操 作 的 次 数 ， 
它 是 衡量 存储 性 能 的 一 个 重要 指标 。 但 此 指标 与 实际 的 物理 场景 有 很 大 关系 ， 如 转速 为 
15000 转 的 FC 磁盘， 随机 读 与 的 TPS 理论 值 在 18$。 当 友 现 菏 个 矿 盘 的 TPS 值 接近 于 这 
个 理论 值 的 时 候 ， 就 表示 此 磁盘 肯定 存在 IO 瓶颈 。 这 时 可 以 参考 2.1.5 节 来 进一步 分 析 存 
储 资 源 的 运行 情况 。 在 Disk 部 分 ， 可 以 获得 每 个 磁盘 的 繁忙 比例 ， 多 个 磁盘 的 繁忙 就 会 成 
为 整个 系统 的 性 能 瓶颈 ， 这 时 应 同时 观察 到 Wait 和 Waitqueue 持续 不 为 0， 表 示 获 得 CPU 
资源 的 进程 在 等 待 VO 数据 。 如 果 同 时 观察 到 系统 内 存 资源 紧张 ， 束 应 先 解决 物理 内 存 资 
源 不 足 的 问题 ， 因 为 系统 内 存 资 源 紧 张 会 导致 大 量 的 换 页 操作 ， 产 生 大 量 的 磁盘 HO， 从 
而 引起 磁盘 繁忙 。 
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图 2-6 中 的 框 选 部 分 显示 了 网 络 状态 数据 。 


Topas Monitor for host: ARAPPSQ EVENTS/QUEUES FILE/TTY 

Wed Oct 10 11:04:59 2012 Interval: 2 Cswitch 375 Readch 676 
Syscall 1935 Writech 1436 
Reads 2 Rawin 0 

Ttyout 268 


| 
| Writes 4 
| Forks 0 lgets 
| 林 大 提 林 林 林 林 林 林 亲 林 亲 并 林 林 林 打 并 林 林 亲 林 ## 亲 林 林 间 林 | Execs 0 Namei 
Runqueue 0.0 Dirblk 
J-Pack 0-Pack KB-In KB-OQut|! Waitqueue 0.0 
109.0 109. 0 5.9 5.9 MEMORY 
9. 5 1. 3 0. 6 0.4| PAGING Real ,MB 31488 
Faults % Comp 41 
TPS KB-—Read KB-—Writ Steals % Noncomp 29 
0.0 0.0 0.0 Pgspln % Client 29 
PgspOut 
FileSystem : TPS KB-Read KB-Writ Pageln PAGING SPACE 
Total 1.0 0.2 0.0 PageOQut Size, MB 32768 
S10S % Used 0 
% Free 100 


图 2-6 网 络 状态 数据 


在 Network 部 分 ， 可 以 观察 到 每 个 网 卡 的 通信 数据 量 ， 结 合 网 络 带 宽 的 硬件 配置 ， 器 
可 以 计算 出 当前 网 络 通信 和 市 冤 与 便 件 配置 之 冤 的 比例 ， 例 如 于 兆 以 太 网 的 通信 流量 实际 最 
高 只 能 达到 85MB/S 左右 。 如 果实 际 流量 接近 这 个 值 ， 就 表示 网 络 通 信 部 分 很 可 能 存在 性 
能 瓶颈 。LPack 和 O-Pack 代表 流入 和 流出 的 数据 包 的 量 ， 这 两 个 值 的 高 低 ， 也 会 代表 网 卡 
的 索 忙 程度 ,比如 千 兆 网 卡 每 秒 钟 处 理 的 数据 包 的 数量 在 20 万 以 下 , 而 万 兆 网 卡 每 秒 钟 处 
理 的 数据 包 的 数量 则 可 以 达到 50 万 左右 。 

某 些 用 户 应 用 需要 大 量 网 络 通 信 ， 所 以 网 络 通信 数据 量 可 以 持续 较 高 ， 但 当 系 统 不 存 
在 其 他 方面 的 性 能 诅 贷 ， 同 时 网 络 通 信和 数据 珊 宽 持续 接近 网 络 物理 市 览 时 ， 束 表示 网 络 和 市 
宽 已 成 为 系统 瓶颈 ， 这 时 需要 参考 2.2.6 节 来 进一步 分 析 网 络 资源 的 运行 情况 。 

如 果 在 topas 监控 界面 没有 能 很 直观 地 观 罕 到 以 上 列 出 的 性 能 问题 ， 束 表示 系统 当时 
基本 运行 正常 。 如 果 这 时 需要 长 期 对 性 能 情况 进行 跟 踊 ， 就 可 以 在 系统 后 台 运 行 nmon 工具 
来 收集 系统 全 天 运行 情况 的 数据 并 做 进一步 分 析 。 因 为 系统 性 能 问题 与 应 用 负载 相关 ， 应 用 
负载 在 每 天 的 不 同时 段 可 能 发 生变 化 , 所 以 收集 系统 全 天 运行 数据 进行 分 析 是 监测 系统 性 能 
状态 的 必要 工作 。 在 系统 全 天 运行 数据 中 识别 出 应 用 繁忙 时 段 和 繁忙 的 硬件 资源 , 然后 在 相 
应 时 段 使 用 系统 性 能 监控 工具 ， 对 系统 运行 状态 进行 详细 分 机 。nmon 工具 是 实现 这 一 需 
求 的 首选 工具 , 它 在 AIX 6.1 以 及 之 后 的 版 本 中 已 经 成 为 操作 系统 目 帝 的 工具 。nmon 工具 
除了 收集 的 指标 很 全 之 外 ， 还 有 配套 的 工具 集 可 以 帮助 完成 一 些 后 续 的 数据 处 理工 作 ， 比 
如 可 以 使 用 这 些 工具 将 收集 到 的 数据 转换 为 图 形 化 的 Excel 格式 的 报告 ， 非 常 便 于 分 析 。 
关于 此 工具 更 详细 的 使 用 方法 ， 有 兴趣 的 读者 可 以 到 IBM 的 网 站 查询 ， 本 书 篇 幅 有 限 不 再 
进一步 说 明 。 


33 


34 


DB2 数据 库 性 能 调整 和 优化 (第 3 版 ) 


2.1.3 监 控 CPU 性 能 


CPU 是 整个 系统 的 核心 资源 ， 通 常 也 是 系统 的 最 繁忙 部 分 ， 某 些 用 户 应 用 需要 进行 大 
量 计算 ， 所 以 CPU 可 能 会 保持 繁忙 。 
通常 ， 服 务 需 都 会 配置 多 个 CPU， 用 sar 命令 可 以 收集 每 个 CPU 的 使 用 情况 。 图 2-7 
所 示 为 2 秒 间 隔 收集 4 次 CPU 使 用 比例 的 数据 ， 方 框 内 的 数据 反映 了 CPU 的 平均 使 用 情 
况 。 如 果 只 有 部 分 CPU 坚 忙 ， 其 他 CPU 保持 空 亲 ， 可 以 调 但 应 用 运行 特点 ， 单 线程 的 应 
用 只 能 运行 在 单个 CPU 上 ， 不 能 充分 利用 多 个 CPU 的 计算 能 力 ， 所 以 尽量 配置 应 用 为 多 
进 ( 线 ) 程 、 多 并 灰 的 应 用 。 
“Cpurel: /#sar —P ALL 2 4 
AIX purel 1 6 00F644F44C00 10/10/12 


13:51:25 cpu ME 工 ET Puio idle 
13:51:27 0 


于 


13:51:29 


= =) 


13:51:31 


3 
2 
2 
00 
3 
3 
2 
1 
2 
2 
2 
2 
00 
1 
3 
1 
3 
2 
2 
2 
2 


13:51:33 


【上 引 ||||||= 


的 一 
[= 本 


0. 
0. 
0. 
0. 
0. 
0. 
2. 
0. 
0. 
0. 
0. 
0. 
0. 
0. 
0. 
”地 
0. 
0. 
0. 
0. 
0. 
0. 
0. 
0. 
2. 
0. 
0. 
0. 
0. 
0. 
0. 
0. 
0. 
2 


eeheoenueeeueriecmeeoeeoeeoeeseeo-eoooowWeeer 
Seeaeoeoeoeeaeeoeoeoeeaeeeeoeoeeoeeoeoeseeeeoeoeeoeeeoeoeoeee 
pee 外 NE 人 NI 


| 
一 大 二 | 
= 时 = 下 = 和 = = 一 === 
二 看 二 二 = 下 -= 
mmm 


图 2-7 收集 CPU 使 用 情况 
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如 果 系 统 中 CPU 的 总 利用 率 ( 用 户 + 系 统 ) 长 时 间 持 续 大 于 80%， 可 以 认为 系统 中 CPU 
可 能 是 瓶颈 。 经 验 法 则 是 : 保持 CPU 利用 率 ( 大 部 分 情况 下 ) 低 于 80%， 这 样 可 以 为 处 理 突 
然 增 加 的 大 量 活动 预 留 CPU 的 处 理 能 力 。 如 果 CPU 存在 明显 的 瓶颈 ， 就 要 找到 造成 瓶颈 
的 原因 并 进行 调 优 , 找 出 原因 的 第 一 步 就 是 定位 占用 CPU 最 多 的 进程 , 接着 再 找 出 进程 中 
消耗 CPU 最 多 的 程序 或 代码 ， 也 就 是 到 底 在 CPU 中 执行 了 什么 。 

在 topas 监控 界面 ,使 用 c 命令 可 以 切换 到 CPU 视图 , 从 而 观察 每 个 CPU 的 使 用 情况 ， 
加 图 2-8 所 示 。 

Topas Monitor for host: plirel EVENTS,/QUEUES FILE/TTY 


Wed Qct 10 13:57:19 2012 Interval: 2 Cswitch 1509 Readch 3150. 5K 
Syscall 22835 Writech 8551 


[i 
已 
~ 

” 帮 
这 


mmnpoooe 
呆 和 = 


Runquetie | Dirblk 
Waitquete 
MEMORY 
PAGING Real .MB 
Faults 1898 % Comp 
steals % Noncomp 
0-Pack 及 了 一 Im KB-Qut Pespln % Client 
Total | 3 3_.0 1.5 业 - 9 5.4 PgspQut 
PagelIn PAGING SPACE 
Disk TPS KB 一 Read KB 一 Writ PageQut Size.MB 16384 
Total ; $35. 2 i10.0 32.0 3.2 Sios ) % Used 0 
% Free 100 
FileSystem TPS KB-Read KB-Writ NFS (calls/sec) 
Total 必 1. 2K 3. 1K 1.9 SerV2 0 WPAR Activ 0 
CliV2 WPAR Total 0 


一 = 


je 


Name PID 
Ca—serve 8519898 
ca—mgmnt 10682604 
IBM. Gb1R 5898456 
1mit 1 
syncd 2556012 
mmf sd64 8847414 
topas 10223630 
hats nim 9764908 
sshd 10289300 
加 已 七 七 站 6815790 
El 1572912 
random 5046366 
hatsd 9044030 
hats nim T7209190 
clstrmer 17411256 
clcomd 3323326 
rpc. lock 6488310 
CaqaKp 3080286 
IBM. Reco T667946 
Xntod 5374196 


0 
Owner SerV3 0 Press: “h -help 
0 


db2sdinl CliV3 
db2sdinl 
root 
root 
root 
root 
root 
root 
root 
Foot 
IGGt 
root 
root 
root 
root 
root 
root 
root 
Foot 
root 


图 2-8 CPU 视图 


使 用 vmstat 命令 也 可 以 收集 CPU 使 用 情况 的 数据 ， 如 图 2-9 所 示 。 


"qn 一 qui 


六 辣 辣 六 辣 辣 辣 六 六 同和 辣 辣 同和 辣 辣 辣 癌 局 六 1! 
SoeoooocooooooocoooooorM,-F 
ds 
CL- 
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Durel:/#vmstat —w 1 6 


System configuration: lcepu=8 mem=8192MB 


kthr memory faults 

HY fre 
T46257 1126566 
T46257 1126566 
T46257 1126566 
T46257 1126566 
T46257 1126566 
T48055 1124768 


sy 
37055 
583 
558 
577 
613 
3611 


一 加 一 居 一 居 一 和 一 下 = 和 盾 :， 
已 已 已 已 已 已 量 
一 大 一 胡 一 本 一 大 一 大 一 四 
号 已 己 怕 已 已 可 


图 2-9 ”使 用 vmstat 命令 


当 已 确定 CPU 繁忙 时 ， 需 要 确定 哪些 进程 正在 消耗 CPU 资源 ， 在 topas 监控 界面 ， 
使 用 P 命令 可 以 切换 到 进程 视图 , 如 图 2-10 所 示 。 移动 光标 到 CPU% 列 ， 对 进程 按照 CPU 
使 用 量 降序 排列 , 大 部 分 的 CPU 资源 应 该 消耗 在 系统 的 应 用 进程 上 。 如 果 出 现 非 核 心 应 用 
进程 占用 大 量 CPU 资源 ， 就 应 该 分 析 该 进程 的 作用 和 产生 原因 ， 以 避免 出 现 CPU 资源 浪 


费 在 与 业务 无 关 的 进程 上 的 情况 。 


Topas Monitor for host-: 


USER 


root 
root 
root 
IrODEt 
root 
root 
IrODt 
root 
root 
roonot 
root 
root 
root 
roonot 
root 
root 
IrOOt 


Pl1D 


9699572 
D898456 

983070 
B847414 
9961694 
6815790 
9764908 
50406366 
1572912 
8716372 
T7209190 
T471256 
8323326 
9044030 
6488310 
5374196 
T667946 


PPID PRI NI 
db2sdinl8519898 10682604 60 20 35387 
db2sdinll1l0682604 11075822 60 20 4048 
10879136 58 41 


5636270 
0 
6225958 
Dobd36210 
1 
9044030 
1 
0 
5308630 
9044030 
5636270 
5636270 
5636270 
1 
5636270 
5636270 


purel 


DATA TEXT PAGE 
RES RES SPACE 


Interval: Wed Oct l10 14:06:46 2012 
PGFAULTS 
TIME CPU% I/0Q OTH COMMAND 
4 35387 18663-47 92.2 0 0 ca—-serve 
29 4048 21:15 0.1 0 0 ca—memnt 
492 141 482 0-00 0.0 0 0 topas 
223 IBM. GblR 
XmEC 
' mmfsd64 
IBM. stor 
getty 
hats nim 
random 
gil 
sshd 
hats nim 
clstrmer 
clcomd 
hatsd 
rpc. lock 
xntpd 
IBM. Reco 


一 时 一 局 一 申 一 


el ee ee 
© 


a rr ra 

Sadooooooogoooooo 
So 

eaaeoeoaeeoeoaeaoaoaeos 


图 2-10 ”进程 视图 


要 进一步 分 析 进 程 和 系统 售 命令 对 CPU 资源 的 使 用 情况 ,可 以 使 用 tprof -usekj -x sleep 9 


命令 ， 该 命令 收集 9 秒 的 
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系统 数据 并 生成 图 2-11 所 示 报 告 
要 注意 的 是 : 此 命令 采用 AIX 瓜 层 的 trace 功能 完成 信息 的 收集 南 
资源 ,在 系统 的 CPU 已 经 很 繁忙 的 情况 下 使 用 此 命令 收集 信息 时 ,: 


收集 数据 时 间 长 短 可 调整 。 需 
部 分 CPU 的 
会 相应 加 重 系 统 的 负担 。 


和 
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该 命令 会 目 动 创建 结果 报告 ， 文 件 的 名 称 默 认为 sleep.prof。 图 2-11 显示 的 只 是 此 报告 的 
开始 部 分 。 


| 


Tv 


purel:- /#cat sleep. prof 
Pn information 


System: AIX 6.1 Node- purel Machine- O00F644F44C00 
Tprof command was- 
tprot 一 usekj —x sleep 9 
Trace command was- 
/usr/bin/trace -ad -—M -L 772494540 -T 500000 --j 00A.001.,002.003,38F.005,006,.,134., 
Total Samples = 7213 
Traced Time = 9.02s (out of a total execution time of 9. 02s) 
二 二 二 二 二 二 二 二 二 二 才 二 二 二 二 二 二 二 二 二 二 二 二 志士 二 二 二 二 二 二 后 二 二 二 二 二 二 二 二 二 二 吉 志 二 成 坑 才 二 二 二 才 二 二 渍 二 二 二 二 二 二 所 二 二 二 二 二 二 二 二 二 才 二 志 二 省志 十 


Process Freqg Total Kernel User Shared Qther Java 
0. 00 
0. 00 
0. 00 
0. 00 
0. 00 
0. 00 
0. 00 
0. 00 
0. 00 
0. 00 
0. 00 
0. 00 
0. 00 
0. 00 
0. 00 
0. 00 
0. 00 
0. 00 


ca—server 

而 忆 工 七 
e/db2sdinl/sqllib/adm/db2rocme 
-ksh 

/bin/ksh 
/usr/bin/echo 
db2rocm 
/usr/bin/awk 
ExecCCommand 
ca—memnt—lwd 
/usr/bin/sed 
/usr/bin/tprof 
IBM. GblResRMd 
/usr/bin/trcstop 
/usr/bin/ksh 
/usr/bin/grep 
/usr/bin/cat 
/usr/bin/sh 

xmec 
/usr/bin/hostname 


= 
SSSSSSSoSSSoSoSoSoSooSoSoo 
cocococococococoococooocoooo0op 


PID TID 


ca—server 8519898 29687991 
ca—server 8519898 47186157 
ca—server 8519898 10354911 
Ca—server 8519898 44695701 
ca—server 8519898 25821349 
ca—server 8519898 10747953 
ca—server 8519898 40435879 


图 2-11 ”收集 系统 数据 


通过 图 2-12 中 所 示 的 命令 ， 可 以 获得 占用 CPU 资源 较 多 的 函数 调用 ， 为 代码 级 的 性 
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Total % For All Processes (USER) = 0.06 
User Process 


/usr/bin/tprof 
/bin/ksh 
/usr/bin/awk 
Profile: /usr/bin/tprof 
Total % For All Processes (/usr/bin/tprof) = 0.03 


Subroutine Source 


.trc kern prof /usr/bin/tprof 
_update tidtbl /usr/bin/tprof 


Profile: /bin/ksh 
Total % For All Processes (/bin/ksh) = 0.01 


Subroutine Source 


-WCcslen glink.s 
Profile: /usr/bin/awk 
Total % For All Processes (/usr/bin/awk) = 0.01 
Subroutine 
/usr/bin/awk 
Total % For All Processes (KERNEL) = 12.74 


Subroutine Source 


h cede end point | _ hcalls.s 

pcs_glue -24 vmwvcs- S 

-unlock enable mem .10 low.s 

hk restore userkeys | 64/skeys. s 

-ld resolvyeredo i nel/ldr/ld symbols_c 


-vyv_lookup mpss ernel/vam/v_ lookup-c 


2.1.4 监控 内 存 使 用 


当 监 探 内 存 时 ， 应 确 体系 统 中 不 存在 频 素 的 内 存 页 的 换 入 (pi-pagingspace pagein) 和 换 
出 (po-pagingspace pageoub， 并 且 系 统 的 空闲 内 存在 $% 左 右 。 

当 系 统 持 续 进行 换 页 操作 时 ， 便 可 以 确定 物理 内 存 资源 么 张 或 者 内 存 资 源 分 配 不 合 
再 。 这 时 首先 要 确定 ， 通 过 调整 虚拟 内 存 管理 器 内 核 参数 来 重新 分 配 内 存 资源 能 否 解决 物 
理 内 存 资源 不 足 的 问题 。 使 用 svmon 命令 可 以 获得 物理 内 存 使 用 的 总 体 信 息 ， 如 图 2-13 
所 示 。 内 存 的 size 值 给 出 了 系统 装配 的 物理 内 存 页 面 数 ，virtual 值 给 出 了 系统 工作 所 需 的 
页 面 数 。 如 果 virtual 值 大 于 size 值 ， 束 表示 物理 和 内存 资 源 不 是 ， 换 页 不 可 避免 ， 此 时 只 
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能 在 便 件 上 升级 物理 内 存 或 配置 用 户 应 用 ， 或 者 通过 减 小 应 用 对 内 存 的 再 求 量 来 解决 此 性 


purel: /#svmon 一 G 


siz free 
memory 1129503 537933 
DE space 4194304 


Work clnt other 
pin 455876 12185 698T72 
in use T41636 225983 


Pagev1ize PoolSize pgsp pin 
4 KB 3692 135901 
0 25127 


图 2-13 ”物理 内 存 使 用 的 总 体 信息 


vmstat 命令 可 用 来 收集 内 存 使 用 数据 和 换 页 数据 ， 如 图 2-14 所 示 。 内 存 的 fre 列表 示 
空闲 的 物理 内 存 页 面 数 ; 内 存 的 avm 列表 示 系 统 工作 所 需 的 页 面 数 。 如 果 此 页 面 数 对 应 的 
容量 大 于 系统 物理 内 存 容量 ， 就 表示 物理 内 存 不 是 ， 换 页 不 可 避 倪 。 需 要 采取 措施 来 处 理 
此 瓶颈 。 


purel: /#vmstat —w 1 6 


System confieguration: lecpu=8 mem=8192ME 


memory faults 


0 
0 
0 
人 0 
0 
0 
图 2-14 使 用 vmstat 命令 


使 用 lsps 命令 可 以 查看 换 页 空间 (Paging Space) 的 使 用 情况 , 如 网 2-15 所 示 。 换 页 空间 
使 用 率 高 并 持续 增加 是 物理 内 存 资源 不 足 的 表现 。 如 果 在 这 种 情况 下 还 不 能 及 时 采取 措施 
以 改善 内 存 的 使 用 ， 那 么 最 终 可 能 会 导致 操作 系统 宕 机 。 


purel : /#1lsps -a 


Page space Physical Yolume Yolume troup Slze WUsed Mctive BAuto lvype Lhksum 
hde hdisk0 rootve 16384NPB SU ves vyes ly 0 


图 2-15 ”使 用 lsps 命令 
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使 用 vmstat -v 命令 可 获得 当前 系统 物理 内 存 中 计算 内 存 和 文件 绥 存 的 配置 参数 ， 以 及 
当前 的 使 用 情况 ， 如 图 2-16 所 示 。 


purel-: /#vmstat 一 
2097152 memory pages 
2018784 lruable pages 
1129061 free pages 
1 memory pools 
538189 pinned pages 
80_.0 maxplin percentage 
-0 minperm percentage 
90.0 maxperm percentage 
10.5 numperm percentage 
213515 file pages 
0.0 compressed percentage 
0 compressed pages 
10.5 numclient percentage 
90.0 maxclient percentage 
213485 client pages 
0 remote pageouts scheduled 
0 pending disk I/0s blocked with no pbuf 
0 paging space I/0s blocked with no psbuf 
2228 filesystem I/0s blocked with no fsbuf 
1348 client filesystem I/0s blocked with no fsbuf 
0 external pager filesystem I/0s blocked with no fsbuf 
36.0 percentage of memory used for computational pages 


图 2-16 使 用 vmstat-v 命令 
当 系统 工作 内 存 不 足 时 ， 下 面 的 命令 可 以 限制 文件 缓存 对 物理 内 存 的 占用 比例 


VBGEDECrUIeSIepageeO 0 maxclient® 90 emazxpernse 90 nperns 3 


Fme DBD Otrict maxecllent TT ootrict maxctrent ND 


e 使 用 svmon -S 命令 可 以 获得 所 有 虚拟 内 存 段 对 物理 内 存 的 使 用 情况 。 
e 使 用 svmon -S -s 命令 可 以 获得 所 有 系统 内 核 内 存 段 对 物理 内 存 的 使 用 情况 
e 使 用 svmon -U 命令 可 以 列 出 所 有 用 户 对 物理 内 存 的 使 用 情况 。 

e 使 用 svmon -P 命令 可 以 列 出 所 有 进程 对 物理 内 存 的 使 用 情况 。 

e 使 用 svmon -P pid 命令 可 以 显示 特定 进程 对 物理 内 存 的 使 用 情况 。 


e 使 用 svmon -C 命令 可 以 显示 由 特定 命令 构成 的 所 有 进程 对 物理 内 存 的 使 用 情况 
请 参看 AIX 虚拟 内 存 管 理 文档 ， 以 了 解 以 上 命令 的 具体 使 用 方法 。 


2.1.5 监控 存储 系统 状态 
如 果 系 统 中 磁盘 IO wait 长 时 间 持 续 大 于 2$%， 可 以 认为 系统 可 能 存在 IO 瓶颈 。 如 
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果 存 在 IO 瓶 贷 ， 就 需要 采取 多 种 措施 进行 调 优 ， 如 调整 IO 资源 的 设置 、 调 整 IO 资源 
的 分 布 等 手段 ， 除 了 这 些 方法 ， 还 可 以 通过 调整 应 用 或 数据 库 层 次 以 减少 不 必要 的 IO 访 
问 ， 最 终 提 高 系统 的 性 能 。 

当 观 测 到 系统 IO 保持 繁忙 时 ， 可 以 先 使 用 topas 查看 存储 的 繁忙 程度 ， 监 控 KBPS、 
TPS 等 指标 ， 然 后 使 用 iostat 命令 收集 磁盘 使 用 数据 ， 如 图 2-17 所 示 。 该 命令 可 以 收集 磁 
盘 人 带宽 的 使 用 率 和 磁盘 IO 数据 吞吐 量 ， 可 以 大 致 估计 系统 数据 吞吐 量 与 应 用 负载 是 否 相 
匹配 ， 避 免 与 业务 无 关 的 大 量 IO 操作 。 

purel:/#iostat 1 3 
System confiegeuration: 1cpu=8g drives=6 paths=2] vdisks=l 


tout ave—cDpu: % user % SYS % idle % iowait 
59_ 0 94.2 0_ 了 5.6 0.0 


Disks: | 攻 Kb read 
hdisk3 

hdisk2 

hdisk5 

hdiskd 

hdiskl 有 

hdisk0 = " -0 2 


七 七 了- i 纺 USer 第 STS 
94_ 3 0_.2 


Disks: . Kb read 
hdisk3 
hdisk2 
hdisk5 
hdiskd 
hdiskl 
hdisk0 


tty- i 和 user 和 % sys 和 % idle % iowait 
风 94.3 0.2 5.5 0.0 


Disks- Kb read Kb wrtn 
hdisk3 

hdisk2 

hdisk5 

hdisk4 

hdiskl 

hdisk0 


图 2-17 ”收集 磁盘 使 用 数据 


使 用 df 命令 可 以 显示 文件 系统 剩余 容量 ， 如 图 2-18 所 示 。 文 件 系统 剩余 容量 过 低 或 
出 现 容量 满 时 ， 写 磁盘 失败 会 导致 很 严重 的 系统 问题 。 
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purel: /#df 一 sg 
Filesystem 


GB blocks Freae* %lUsad 
/dev/hd4 

/dev/hd2 
/dev/hd9var 
/dev/hd3 

/dev/hdl 
/dev/hdlladmin 
/proc 
/dev/hdlO0opt 
/dev/livedump 
/dev/1v00 
/dev/lvycmbc admin 


Iusaed %Iused Mounted on 


6% /usr 
1% /var 
1% /tmp 
1% /home 

1% /admin 
—- /proc 
2% /opt 
1% /var/adm/ras/livedump 
1% /var/adm/csd 

1% /cmbc admin 


/dev/db2data 
/dev/db2fsl1 


300. 00 
100. 00 98.7 


2% /db2data 
六 /db2sd 20120908150547 


图 2-18 ”显示 文件 系统 剩余 容量 


dd 命令 可 以 与 time 命令 配合 来 测试 IO 的 顺序 读 、 写 带宽 。 存储 带 宽 测 试 工作 需要 选 
择 系统 空闲 时 段 进 行 ， 从 而 避免 影响 实际 系统 的 性 能 。 获 得 存储 带宽 后 ， 就 可 以 与 实际 的 
业务 需求 进行 比较 , 判断 存储 带宽 是 否 满足 业务 负载 需求 。 但 需要 注意 的 是 ， 此 类 型 的 VO 
测试 的 IO 是 顺序 WO， 而 实际 的 场景 中 往往 是 随机 WO， 随 机 LO 的 访问 效率 要 远 远 低 于 
顺序 IO。 

这 里 简单 补充 一 下 顺序 WO 和 随机 LO 的 基本 概念 。 顺 序 VO 指 的 是 本 次 IO 给 出 的 
初始 忆 区 地 址 和 上 一 次 VO 的 结束 扇 区 地 址 完全 连续 或 相隔 不 多 。 反 之 ， 如 果 相 差 很 大 ， 
就 算 作 一 次 随机 VO。 顺序 IO 比 随机 LO 效率 高 的 原因 是 ， 在 做 顺序 IO 的 时 候 ， 磁 头 几 
乎 不 用 换 道 ， 或 者 换 道 的 时 间 很 短 ; 而 对 于 随机 IO， 如 果 这 种 IO 很 多 的 话 ， 会 导致 磁头 
不 停 地 换 道 ,造成 效率 极 大 降低 .下 面 列 出 了 典型 的 FC 磁盘 的 相关 指标 ,例如 转速 为 15000 
转 、 容 量 为 148GB 的 磁盘 的 指标 如 下 : 

e 顺序 IO 速率 : 88MBAs 

e 顺序 IO 的 IOPS: 1421 

e 随机 LO 速率 : 12MB/s 

e 随机 LO 的 IOPS: 185 

由 此 我 们 看 到 对 于 同样 的 磁盘 ，L/O 访问 的 类 型 不 一 样 ，L/O 的 能 力 区 别 也 会 非常 大 ， 
因此 ， 我 们 在 评估 了 IO 瓶 人 须 时 需要 根据 实际 情况 进行 分 析 和 判断 。 

2.1.6 监控 网 络 状态 

网 络 成 为 性 能 瓶 锋 的 场景 并 不 多 见 ， 一 般 多 发 生 在 多 分 区 数据 库 的 环境 下 ， 在 网 络 负 
载 较 高 的 情况 下 ， 对 这 方面 进行 某 些 调 优 也 可 以 提高 性 能 。 如 果 系 统 的 CPU 和 LO 利用 率 
都 很 低 ， 那 么 可 以 进一步 观察 、 分 析 网 络 是 否 可 能 是 性 能 的 瓶 贷 。 在 多 分 区 数据 库 (DPF) 
中 ， 如 果 分 区 策略 产生 了 一 些 非 合并 连接 ， 那 么 可 能 导致 最 严重 的 性 能 下 降 ， 而 且 撼 倾 很 
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可 能 是 IO 造成 的 ， 因 为 对 于 DPF 数据 库 ， 分 区 之 间 可 能 会 出 现 大 量 的 数据 传输 ， 从 而 造 
成 网 络 成 为 性 能 的 瓶 须 。 

使 用 netstat 命令 监控 网 络 通 信 状 况 ， 如 图 2-19 所 示 。 如 果 errs 列 持 续 不 为 0， 束 表示 
网 络 设 备 存在 故障 ， 需 要 定位 具体 原因 来 解决 。 


purel: /#netstat 2 
input (ib0) output input (Total) output 
Dackets errs packets errs colls packets errs packets errs 


4512526 0 4326865 0 6214094 0 57250555 0 


过 | 要 


一 用 一 局 一 局 一 用 一 下 一 和 一 必 一 
一 看 一 导 一 一 上 一 丰 一 丰 == 
三 用 二 是 三 昨 二 时 二 是 二 是 二 用 二 必 二 | 


图 2-19 监控 网 络 通 信和 状况 
使 用 topas 售 令 可 以 但 看 网 络 通 信 数 据 的 实时 厨 吐 量 ， 观 察 网 络 得 入 数据 量 和 输出 数 
据 量 是 否 与 业务 量 相 待 ， 如 儿 2-20 所 示 。 按照 之 机 的 分 析 ， 如 末 单 块 干 兆 网 卡 不 满足 性 能 
紧 求 时 ， 可 以 更 换 成 万 兆 网 卡 或 通过 双 网 卡 绑 定 方式 来 增加 网 络 行 吐 量 。 


Network KBPS I-Pack 0Q-Pack 
en0 名 _ 9 12.0 10.5 


ib0 0.3 1.0 1.5 
1o0 0- 1 1.0 1.0 


图 2-20 ”查看 网 络 的 实时 吞吐 量 


在 AIX 系统 中 使 用 no 命令 可 以 调整 网 络 通信 相关 的 和 内核 参数 。 


2.2 ” 控 作 系统 性 能 优化 


在 进行 操作 系统 性 能 优化 工作 前 ， 您 需要 了 解 应 用 系统 所 有 的 层次 ， 因 为 它们 分 别 会 
以 不 同 的 方式 对 性 能 产生 影响 。 在 第 一 次 设置 您 的 系统 时 , 对 于 磁盘 的 配置 , 可 以 从 底层 ( 物 
理 层 ) 开 始 ， 然 后 是 设备 层 、 风 辑 卷 、 文 件 系统 、 文 件 和 应 用 程序 。 规 划 您 的 物理 存储 环境 
是 非常 重要 的 ， 这 一 点 无 论 怎样 强调 都 不 为 过 。 关 于 存储 的 IO 设计 我 们 在 2.5 节 以 后 详细 
讲述 ， 这 涉及 确定 RAID 级 别 、 存 储 规 划 等 。 

如 前 所 述 ， 与 任何 可 调整 的 IO 参数 相 比 ， 糟 糕 的 数据 布局 和 LO 访问 方式 将 会 给 IO 
性 能 带 来 更 大 的 影响 。 查 看 IO 栈 可 以 帮助 您 理解 这 一 点 ， 因 为 逻辑 卷 管理 器 (Logical 
Volume Manager，LVM) 和 磁盘 的 分 布 情况 要 比 优化 参数 (ioo 和 vmo) 更 接近 于 上 捕 层 。 
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从 图 2-21 可 以 看 出 ， 物 理 LO 组 件 与 逻辑 人 磁 如 及 其 应 用 程序 LO 之 间 非 常 紧密 地 关联 
在 一 起 ， 这 也 正 是 通常 将 其 称 为 AIX LO 栈 的 原因 。 


Application ’ \ [/0 to a file 
同步 I/0， 异 步 1/0 | open()close()read()write() 文件 1/0 读 写 


mount umount 
Filesystem 


Mount opt1ons crfs wk bi liknieap tad chnfs| I/0 to blocks 


影 啊 I/0 读 写 方式 mkfs showmount in a filesystem 
dio cio rbr rbrw logform |cfsadmin 
rbw 


mount 一 0 File I/0 to 
VMM cio/dio a filesystem cache 


pe extendve mklv importve 
LVM exportve mklvecopy cply 
A migratepv varyonvg 
l Block I/0 to 
Device Drivers | lsattr chdev mkdev rmdev | logical disk 


DISK subsvstem EMC/HDS/IBM Shark/HP EVA 等 Block I/0 to a 
DISK 勿 理 人 硬盘. . . phvsical disk 


-Disk I/0 flows from top to bottom 
-Phvsical Disk/Lavout flows from bottom to top 


图 2-21 AIX 10O 栈 
2.2.1 直接 |/O 和 并 发 |/O 


操作 系统 和 文件 系统 对 VO 的 控制 存在 多 种 方式 ， 不 同 的 VO 方式 对 数据 库 的 VO 性 
能 影响 也 不 同 。 


1. 直接 |/O 


那么 , 什么 是 直接 IO(DirectIO, DIO) 呢 ?直接 IO 在 AIX Version 4.3 中 被 首次 引入 ， 
IO 方法 不 经 过 虚拟 内 存 管 理 右 (Virtual Memory Manager，VMM)， 而 是 从 应 用 程序 的 
de 与 磁盘 进行 数据 传输 。 在 某 些 特定 的 场景 ， 使 用 这 种 技术 时 可 以 提高 VO 的 性 
。 例 如， 那些 具有 糖 糕 绥 存 使 用 率 的 文件 ， 是 使 用 直接 IO 的 很 好 的 候选 对 象 。 直 接 IO 
还 可 以 提高 那些 全 同步 与 入 操作 的 应 用 程序 的 效率 ， 因 为 这 些 与 入 操作 的 对 象 是 位 盘 。 
下 常情 况 下 ， 需 要 将 磁盘 的 数据 复制 到 文件 系统 缓冲 区 缓存 ， 然 后 在 将 数据 复制 到 应 用 程 
友 的 缓冲 区 时 就 会 出 现 多 余 的 副本 。 百 接 IO 降低 了 CPU 使 用 率 ， 这 是 因为 减少 了 一 次 数 
据 在 内 存 中 sm 直接 IO 的 主要 性 能 开销 是 ， 尽 管 可 以 降低 CPU 使 用 率 ， 但 却 可 能 导 
致 进程 长 时 间 等 待 较 小 请 求 的 完成 。 请 注意 ， 这 种 方式 适用 于 在 磁盘 上 具有 持久 存储 位 置 
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的 持久 段 文件 。 当 使 用 正 S2 不 通过 直接 IO 访问 文件 时 ， 文 件 作为 本 地 页 面 缓存 ， 并 且 将 
数据 复制 到 RAM 中 。 和 直接 IO 可 以 在 许多 方面 为 您 提供 与 使 用 原始 多 辑 卷 ( 通 冲 也 可 以 称 
之 为 裸 设备 ，raw device) 类 似 的 性 能 ， 同 时 还 保留 了 使 用 正 S 文件 系统 的 优点 (例如 易于 
管理 )。 


2. 并 发 I/O 


并 发 IO(Concurrent IO，CIO) 又 如 何 昵 ? 并 发 IO 在 AIX Version 5.2 中 被 首次 引入 ， 
首先 ， 并 发 IO 包含 了 直接 VO 相关 联 的 所 有 功能 和 优势 。 使 用 标准 的 直接 IO， 会 对 过 
引 节点 (与 文件 相关 联 的 数据 结构 ) 加 锁 ， 以 防止 出 现 多 个 线程 试图 同时 更 改 某 个 文件 的 内 
容 的 情况 。 并 发 IO 绕 过 了 过 引 节 点 锁 ， 这 样 可 以 允许 多 个 线程 并 发 地 读 写 相同 文件 的 数 
据 。 这 是 因为 正 S2 在 实现 时 使 用 了 写 独 占 (write-exclusive) 款 引 刷 点 饥 ， 人 允许 多 个 用 户 同 时 
读 取 相同 的 文件 。 可 以 想象 ， 直 接 IO 可 能 使 得 不 断 地 从 相同 文件 读 取 数 据 的 数据 库 产生 
很 大 的 问题 。 并 发 VO 则 解决 了 这 一 问题 ， 这 正 是 该 特性 主要 用 于 关系 数据 库 的 原因 。 与 
直接 IO 类 似 ， 您 可 以 通过 open 系统 调用 或 者 通过 装 入 文件 系统 来 实现 这 种 方式 ， 如 下 
所 示 : 


# mount -oO cio /sapr3/prod 


当 您 使 用 这 个 命令 装 入 文件 系统 时 ， 其 中 所 有 的 文件 都 使 用 并 发 TO。 与 使 用 直接 IO 
相 比 ， 并 发 IO 几乎 可 以 提供 使 用 原始 逻辑 卷 的 所 有 优点 , 同时 保持 文件 系统 的 易 管理 性 。 
请 注意 ， 您 不 能 对 下 SC 只 能 对 下 S2) 使 用 并 发 1O。 而且， 对 于 那些 受益 于 文件 系统 预 读 功 
能 或 者 较 高 缓冲 区 缓存 命中 率 的 应 用 程序 ， 可 能 会 出 现 性 能 的 降低 。 因 此 使 用 CIO 时 需要 
确认 应 用 确实 能 够 支持 这 种 IO 方式 ， 并 且 能 够 从 中 获 益 ， 尤 其 是 不 能 中 途 再 修改 为 CIO 
方式 ， 这 样 风险 会 很 高 。 


2.2.2 ”异步 IO 和 同步 |/O 


ms 


通常 ， 用 得 比较 多 的 IO 模型 是 同步 IO(Synchronous IO)。 在 这 种 模式 下 ， 当 请 求 发 
出 之 后 ， 应 用 程序 就 会 被 阻 终 ， 直 到 请 求 返 回 为 止 。 这 种 模式 的 最 大 好 处 就 是 调用 应 用 程 
序 在 等 待 VO 请 求 完成 时 不 需要 使 用 CPU 资源 ， 而 且 这 种 方式 也 能 满足 必须 完成 特定 
的 IO 才能 执行 后 续 工 作 的 应 用 需求 。 但 是 ， 对 于 一 些 强调 高 啊 应 速度 的 OLTP 应 用 来 
说 ， 布 望 这 种 等 每 时 间 越 短 越 好 ， 此 时 就 该 考虑 采用 异步 TO(Asynchronous IO) 模 式 了 。 

异步 IJO 是 什么 情况 呢 ?” 同 步 VO 和 异步 VO 的 区 别 是 应 用 程序 是 否 等 待 IO 完成 后 再 
开始 后 续 处 理 。 其 中 ， 同 步 IO 指 的 是 应 用 程序 必须 等 待 VO 处 理 完 以 后 才能 开始 后 续 处 
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理 ， 而 异步 VO 正好 相反 ， 应 用 程序 不 需要 等 VO 处 理 完 ， 只 要 在 发 出 了 IO 请 求 之 后 就 
可 以 开始 后 续 处 理 了 ， 所 以 异步 IO 人 允许 应 用 程序 在 发 出 了 IO 请 求 的 同时 继续 处 理 其 他 
工作 。 正 确 地 使 用 异步 VO 可 以 极 大 地 提高 IO 子 系统 读 写 操作 的 性 能 。 这 种 方式 能 够 提 
高 性 能 是 因为 允许 WO 和 应 用 程序 处 理 同 时 运行 。 对 于 数据 库 环境 ， 局 用 异步 IO 的 确 可 
以 起 到 提 局 性 能 的 作用 。 

异步 JJO 可 以 使 再 要 大 量 谈 写 的 DB2 线程 (如 db2pfchr、db2pclnr 线程 ) 将 IO 请 求 队列 
化 ， 以 充分 利用 硬件 的 IO 带宽 ， 从 而 使 它们 能 在 最 大 程度 上 实现 并 行 处 理 。 异 步 IO 还 
可 以 使 那些 需要 进行 大 量 计 算 的 操作 (如 排序 )， 在 它们 发 出 VO 请 求 前 预先 从 磁盘 取出 数 
据 ， 使 VO 和 计算 并 行 处 理 。 

我 们 如 何 监控 异步 IO 服务 器 的 使 用 率 呢 ? iostat 和 nmon 命令 都 可 以 监视 异步 LO 服 
务 器 的 使 用 率 。 确 定 您 的 系统 中 配置 的 异步 IO 服务 器 数量 的 标准 命令 是 : 

pstat ea | egrep " aloservar | we —1 


iostat -A 命令 可 以 报告 异步 IO 统计 数据 : 


4 65tat A 
System configuration: lcpu=2 drives=3 ent=0.60 paths=4 vdisks=4 


al0: avgc avfc maxgc maxfc maxredqds avVvgq-cpu: $$ user 当 SYS $ ldle 当 lowalt physc 


entc 
0 0 32 0 4096 6.4 8.0 85.4 人 dl | 16.0 
Disks: 年 七 mn et Kbps tps Eb read Kb wrin 
hdisk0 .3 2 0 .5 0 4 
hdiskl ] sD I 1 3 8 4 
hdilask2 0 .0 0 .0 0 .0 0 0 


所 有 这 些 内 容 究 竟 表 示 什 么 呢 ? 

e avgc: 报告 了 在 您 所 指定 的 时 间 间 隔 内 平均 每 秒 的 全 局 异步 IO 请 求 数量 。 

e avfc: 报告 了 在 您 所 指 定 的 时 间 间 隔 内 平均 每 秒 的 快速 路 径 请 求 数量 。 

e maxgc: 报告 了 从 上 次 获取 该 全 以 来 的 最 大 全 局 异步 IO 请 求 。 

e maxfc: 报告 了 从 上 次 获取 该 值 以 来 的 最 大 快速 路 径 请 求 计数 。 

e maxreqs: 这 是 所 允许 的 最 大 异步 IO 请 求 数 。 

在 AIX 6.1 及 以 后 的 版 本 中 ， 异 步 VO 的 使 用 和 设置 被 大 大 简化 了 ， 一 上 般 无 须 进行 设 
置 ， 异 步 IO 会 目 动 后 动 并 且 会 目 动 调整 异步 VO 服务 的 数量 。 
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2.2.3 minpout 和 maxpout 


当 系 统 内 有 其 他 应 用 在 做 大 量 的 IO 操作 时 ， 用 户 可 能 会 页 到 诸如 交互 性 能 受到 严 草 
影 啊 等 问题 。LO 处 理 速率 调整 是 AIX 的 一 项 特性 ， 它 可 以 防止 因 使 用 大 量 个 和 一 IO 的 应 
用 程序 而 使 得 CPU 和 磁盘 超载 。 正 确 地 使 用 磁盘 IO 处 理 速率 调整 ， 可 以 帮助 防止 因 生 成 
大 量 输出 的 程序 而 使 系统 的 IO 阻 窒 , 并 导致 系统 性 能 降低 。 优化 maxpout 和 minpout 可 
以 帮助 防止 对 文件 执行 顺 友 写 入 操作 的 线程 占用 过 多 的 系统 资源 。 

建议 高 站 存储 : minpout 设置 成 512，maxpout 设置 成 1024。 低 闹 存 储 : minpout 设置 
成 24，maxpout 充 胃 成 33。 


2.2.4 ”文件 系统 和 裸 设备 


我 们 知道 ， 内 存 的 谈 写 效率 比 倒 盘 高 近 万 倍 。 因 此 ， 数 据 库 通 闻 会 在 内 存 中 开辟 一 卢 
区 域 ， 称 为 Buffer Pool( 或 Buffer Cache)， 使 数据 的 谈 与 尽量 在 该 部 分 内 存 中 完成 。 同 样 ， 
在 文件 系统 中 ， 操 作 系 统 为 了 提高 谈 与 效率 ， 也 会 为 文件 系统 开辟 一 块 Buffer 用 于 缓存 最 
近 被 访问 过 的 文件 。 这 样 ， 数 据 库 中 的 数据 很 有 可 能 会 被 缓存 两 次 。 为 了 避免 两 次 缓存 造 
成 的 内 存 和 CPU 浪费 ， 所 以 不 希望 文件 系统 进行 缓存 。 解 决 的 方法 有 多 种 ， 其 中 一 种 (万 
其 是 在 没有 CIO 技术 之 前 ) 是 采用 裸 设备 (Raw Device) 作 为 数据 文件 的 存储 设备 。 裸 设备 ， 
义 称 为 裸 分 区 (Raw Partittion)， 是 指 没 有 被 加 载 (Mounb 到 操作 系统 的 文件 系统 上 的 磁盘 分 
区 , 可 通过 字符 设备 驱动 来 访问 。 裸 设备 的 LO 读 写 不 由 操作 系统 控制 , 而 是 由 应 用 程序 (如 
数据 库 ) 下 接 控 制 |。 

1. 裸 设备 的 优点 

1) 由 于 屏 获 了 文件 系统 缓冲 区 而 进行 直接 谍 写 ， 从 而 具有 更 好 的 性 能 。 对 便 盘 的 直接 
谈 写 丈 意 味 看 取消 了 硬盘 与 文件 系统 的 同步 需求 。 这 一 点 对 于 纯 OLTP 系统 非常 有 用 ， 
为 在 这 种 系统 中 ， 读 与 的 随机 性 非常 大 ， 以 全 于 一 旦 数据 被 读 写 之 后 ， 它 们 在 今后 较 长 的 
一 段 时 间 内 都 不 会 得 到 再 次 使 用 。 除 了 OLTP， 裸 设备 还 能 够 从 以 下 几 个 方面 改善 OLAP 
应 用 程序 的 性 能 : 

e 排序 : 对 于 OLAP 环境 中 大 量 存在 的 排序 需求 ， 裸 设备 所 提供 的 百 接 与 功能 也 非 

向 有 用 ， 因 为 对 临时 表 空 间 的 写 动 作 速 上 度 更 快 。 

e 顺序 访问 : 裸 设 备 非 常 适合 于 顺序 IO 动作 。 同 样 ，OLAP 中 常见 的 顺序 IO( 表 / 

索引 的 全 表 扫 摘 ) 使 得 和 刹 设 备 更 加 适用 于 这 种 应 用 程序 。 

2) 直接 谈 与 ， 不 需要 经 过 操作 系统 级 的 缓存 。 贡 约 了 内 存 资源 ， 在 一 定 程度 上 避免 了 
内 存 的 苋 争 。 

3) 避免 了 操作 系统 的 cache 预 读 功能 ， 减 少 了 LO。 
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4) 采用 裸 设备 避免 了 文件 系统 的 开销 。 比 如 维护 mode、 空 末 块 等 。 
5) 文 持 并 发 访问 ， 在 需要 多 个 线程 或 进程 同时 并 发 地 访问 同样 的 数据 时 ， 可 以 采用 裸 
设备 ， 因 为 禄 设备 没有 文件 系统 中 的 inode 人 锁 等 相关 的 锁 概 念 。 


. 裸 设 备 的 缺点 


e 镜 议 备 的 空间 管理 不 有 灵活。 在 放置 裸 设备 的 时 候 ， 需 要 预先 规划 好 裸 设 备 上 的 衬 
间 使 用 。 还 应 当 保 留 一 部 分 棵 设备 以 应 付 突 友情 况 ， 这 也 是 对 空间 的 滔 费 。 
e 很 多 备份 软件 对 裸 设备 的 文 持 不 是， 导致 备份 等 操作 和 方法 比较 原始 、 采 烦 。 


3. 文件 系统 的 优点 


文件 系统 易于 管理 和 维护 ， 可 以 非常 方便 地 进行 扩展 ， 很 容易 实现 系统 的 高 可 用 和 采 
用 存储 技术 进行 灾 备 。 目 前 主要 版 本 的 Linux 和 AIX 操作 系统 中 默认 就 提供 了 CIO 文件 系 
统 的 访问 方式 ， 这 已 经 和 裸 设备 的 性 能 不 相 上 下 ， 所 以 建议 大 家 尽量 采用 文件 系统 作为 
DB2 表 空 间 的 容器 。 


2.2.5 负载 均衡 及 条 市 化 (Striping) 


当 多 个 进程 或 线程 同时 访问 磁盘 时 ， 会 出 现 磁盘 冲突 。 大 多 数 磁盘 系统 都 对 访问 次 数 
(每 秒 的 IO 操作 ) 和 数据 传输 率 ( 每 秒 传输 的 数据 量 ) 有 限制 。 当 达到 这 些 限制 时 ， 后 面 需要 
访问 磁盘 的 进程 承 需 要 等 待 ， 这 怠 是 所 谓 的 磁盘 冲突 。 

避免 磁盘 冲突 是 优化 VO 性 能 的 重要 手段 ， 为 了 最 大 程度 地 避免 磁盘 冲 突 ， 束 需要 将 
所 有 的 LO 访问 负载 均衡 分 担 到 所 有 可 用 的 磁盘 上 ， 也 就 是 IO 负载 均衡 。 在 一 些 成 熟 的 
磁盘 人 负载 均衡 技术 出 现 之 前 ，DBA 需要 了 解 并 预测 各 系统 的 IO 负载 量 ， 通 过 手工 配置 每 
个 数据 到 不 同 存放 位 置 以 分 担 IO 负载 ， 进 而 达到 负载 均衡 的 目的 。 

而 目前 实现 这 一 需求 的 最 普遍 技术 束 是 条 市 化 技术 ， 也 就 是 将 一 块 连续 的 数据 分 成 很 
多 小 部 分 ， 并 把 它们 分 别 存储 到 不 同 磁盘 上 。 这 样 进程 在 访问 数据 的 时 候 ， 可 以 同时 向 多 
个 不 同 部 分 同时 发 出 IO 请 求 ， 由 于 这 些 数 据 存 放 在 不 同 的 磁盘 上 ， 因 而 不 会 造成 磁盘 冲 
突 ， 而 且 在 需要 对 这 种 数据 进行 顺序 访问 的 时 候 可 以 获得 最 大 程度 上 的 WO 并 行 能 力 ， 从 
而 获得 非常 好 的 性 能 。 很 多 操作 系统 、 磁 盘 设备 供应 商 、 各 种 第 三 方 软件 都 能 做 到 条 市 化 。 
通过 条 市 化 ，DBA 可 以 很 轻松 地 做 到 IO 负载 均衡 而 无 顷 手 工 配置 。 

由 于 条 融化 在 IO 性 能 问题 上 的 优越 表现 ， 以 至 于 应 用 系统 计算 环境 中 的 多 个 层次 或 
平台 都 涉及 该 技术 。 例 如 ， 操 作 系 统 和 存储 系统 这 两 个 层次 中 都 可 能 使 用 条 带 化 技术 ， 图 
2-22 展示 了 这 两 个 层次 的 VO 结构 。 
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应 用 系统 


图 2-22 条 带 化 技术 在 操作 系统 和 存储 系统 中 的 应 用 
在 介绍 了 存储 底层 的 条 市 化 之 后 ， 我 们 将 讲解 操作 系统 的 条 市 化 。 
1. 条 带 化 的 设置 


由 于 现在 的 存储 技术 成 熟 、 成 本 降低 ， ES 
载 均衡 。 如 果 操 作 系 统 有 LVM(Logical Volume Manager， te HH 
备 ,我 们 就 可 以 利用 这 些 工具 来 分 布 O 负载 。 当 使 用 LVM 或 硬件 条 带 时 ， 影 响 条 带 
要 设置 是 条 市 深度 (stripe depth) 和 条 市 宽度 (stripe width): 

e 条 和 市 深度 指 的 是 条 市 的 大 小 ， 也 叫 条 带 单元 。 

e 条 市 宽度 指 的 是 同时 可 以 并 友 谈 或 写 的 条 市 数量 。 这 个 数量 等 于 条 市 集中 的 物理 

便 盘 数量 。 

您 需要 根据 系统 的 IO 要 求 来 合理 地 选择 这 些 数据 。 i 

的 条 和 带 深度 是 从 64KB 到 1MB。 下 和 面 分 析 条 和 带 深 上 度 和 条 带宽 度 的 影响 因素 。 
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2. 条 市 识 上 度 

为 了 提高 IO 效率 ， 我 们 要 尽量 使 一 次 逻辑 IO 请 求 转换 成 物理 IO 请 求 后 ， 对 于 一 
块 磁 盘 只 产生 一 次 物理 IO 请 求 。 因 而 影响 条 市 的 重要 因素 就 是 一 次 迪 辑 VO 请 求 的 大 小 。 

此 外 ， 系 统 中 VO 的 并 发 度 不 同 ， 我 们 对 条 市 的 配置 要 求 也 不 同 。 例 如 ， 在 高 并 发 度 
且 VO 请 求 的 大 小 都 比较 小 的 情况 下 ， 我 们 希望 一 块 磁盘 能 同时 响应 多 个 IO 操作 ;， 而 在 
那些 存在 大 VO 请 求 的 低 并 发 度 系统 中 ,我 们 可 能 就 需要 多 块 磁盘 同时 啊 应 一 个 IO 请 求 。 
无 论 是 一 个 磁盘 还 是 多 个 磁盘 啊 应 IO 请 求 ， 我 们 的 原则 之 一 是 让 一 次 逻辑 IO 能 被 一 次 
处 理 完 成 。 

为 了 实现 这 一 上 日 标 ， 通 常 需 要 根据 应 用 环境 的 具体 情况 进行 仔细 规划 。 

3. 条 带宽 度 


正如 我 们 前 面 所 述 , 无 论 是 一 个 还 是 多 个 人 磁盘 响应 逻辑 WO, 我 们 都 要 求 VO 能 被 一 次 
处 理 。 因 而 在 确定 了 条 市 深度 的 基础 上 ， 我 们 需要 保证 : 

条 带宽 度 >= I/o 请 求 的 大 小 /条 市 深度 

4. 数据 库 对 条 带 化 的 影响 


下 和 面 先 看 以 下 影响 IO 性 能 的 操作 系统 和 DB2 数据 库 的 相关 参数 : 
e pagesize: DB2 中 的 数据 页 大 小 ， 也 决定 了 DB2 一 次 单个 IO 请 求 中 数据 块 的 


大 水 。 
e prefetchsize: 在 预 取 该 时 ， 一 次 谈 取 数据 块 的 数量 不 能 大 于 操作 系统 的 最 大 IO 
大 水 。 


e Sortheap: 内 存 中 sort 区域 的 大 小 ， 也 决定 了 并 发 排序 操作 时 的 IO 大 小 。 

其 中 ， 前 面 两 个 是 最 关键 的 两 个 参数 。 

在 OLTP 系统 中 ， 会 存在 大 量 小 的 并 发 的 IO 请 求 。 这 时 就 需要 考虑 选择 比较 大 的 条 
带 深度 。 使 条 禹 深度 大 于 VO 大 小 就 称 为 粗 粒 度 条 和 带 (Coarse Grain Striping)。 在 高 并 行 度 系 
统 中 ， 条 市 深度 为 n* page size， 其 中 为 大 于 1 的 整数 。 

通过 粗 粒度 条 和 带 能 实现 最 大 的 LO 吞吐 量 (一 次 物理 IO 可 以 同时 啊 应 多 个 并 发 的 逻辑 
LO)。 大 的 条 弟 深 上 度 能 够 使 像 全 表 扫 摘 那 样 的 预 取 读 操 作 由 一 个 人 磁盘 驱动 来 响应 ， 并 提 噩 
预 取 读 操作 的 性 能 。 
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在 低 并 发 度 的 OLAP 系统 中 ， 由 于 IO 请 求 通常 序列 化 ， 为 了 避免 出 现 IO 集中 的 热 
点 磁盘 ， 我 们 需要 避免 逻辑 IO 只 由 一 块 磁 盘 处 理 的 情况 发 生 。 这 时 粗 粒 度 条 带 就 不 适合 
了 。 我 们 选择 小 的 条 带 深度 ， 使 一 个 逻辑 IO 分 布 到 尽 可 能 多 的 磁盘 上 ， 从 而 实现 IO 的 
负载 均衡 。 这 就 叫 细 粒 度 条 和 带 。 条 和 带 深 度 的 大 小 必须 为 预存 取 参 数 大 小 (prefetchsize) 的 整 

如 果 您 的 条 带 宫 度 设 置 得 比较 小 ， 就 需要 估算 出 各 个 数据 库 表 空 间 容 右 的 VO 负载 ， 
并 根据 负载 量 不 同 将 它们 分 别 部 车 到 不 同 卷 上 来 分 担 VO 负载 。 


5. 操作 系统 对 条 市 化 的 影响 


e 操作 系统 最 大 LO 大 小 : 决定 了 一 次 单个 IO 请 求 的 大 小 上 限 , 不同 的 操作 系统 有 
不 同 的 参数 ，AIX 系统 是 卷 组 的 LIG(Logical Track Group) 参 数 。 

e 操作 系统 级 别 条 带 化 的 设置 。 

操作 系统 最 大 IO 大 小 对 条 和 融化 深度 的 设置 也 产生 着 重要 的 影响 。 当 逻辑 IO 请 求 到 
达 操 作 系统 之 后 ， 如 果 罗 辑 VO 的 大 小 超过 了 操作 系统 所 能 处 理 的 最 大 IO 大 小 ， 操 作 系 
统 会 根据 目 己 能 够 处 理 的 最 大 IO 大 小 来 分 割 馆 辑 IO 请 求 ,在 AIX 中 ,这 个 参数 就 是 LTG。 
也 就 是 说 ， 当 逻辑 IO 的 大 小 超过 了 所 在 卷 组 的 LIG 设置 时 ，AIX 会 在 将 好 辑 IO 以 LTG 
为 单位 进行 分 割 之 后 ， 才 将 分 割 好 的 IO 请 来 分 友 到 物理 存储 中 去 。 所 以 LTIG 的 大 小 应 该 
与 条 带 深 度 大 小 相同 或 是 条 带 深 度 大 小 的 整数 倍 。 

在 AIX V5.3 以 后 ， 卷 组 的 LTG 参数 是 在 varyonvg 的 时 候 指定 的 ， 语 法 如 下 : 


Varyonvg -M 212K vgname 


上 面 的 语句 将 埠 组 “vgname ”的 LTG 参数 设置 为 S12KB， 每 次 在 varyonvg 大 组 的 时 
候 可 以 设置 不 同 的 LTG( 在 AIX V5.3 之 前 ,LTG 是 在 创建 卷 组 的 时 候 设 置 ,并 且 不 能 修改 )。 
日 前 LTG 的 取 值 范围 为 : 128KB、256KB、512KB、1MB、2MB、4MB、8MB、16MB、 
32MB 和 128MB 。 而 且 如 果 卷 组 中 PV 不 能 文 持 LTG 的 设置 ，varyonvg 命令 会 失败 。 

很 多 操作 系统 文 持 操作 系统 级 别 的 条 带 化 (而 不 是 存储 系统 提供 的 条 带 化 )， 条 珊 技 术 
原理 与 之 前 介绍 的 无 异 。 操 作 系 统 级 别 的 条 市 化 又 分 为 馆 辑 条 市 化 和 物理 条 市 化 两 种 。 远 
辑 条 融化 通 负 是 通过 LVM 在 LV 级 别 实现 的 ， 而 物理 条 市 化 通常 是 通过 操作 系统 机 右上 
的 硬件 实现 的 。 在 这 里 介绍 一 下 AIX 操作 系统 中 LVM 实现 的 逻辑 条 剖 化 技术 。 

AIX 系统 中 LVM 的 基本 结构 如 图 2-23 所 示 。 
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AIX Logical Volume Manager-The Big Picture 


EE 巷 组 (VG) 逻辑 卷 (LV) 


一 一 一 


区 | 站 下 EE XI 
/ 
才 物理 铬 (PY . : 
人 物理 着 CO 人 PW dl 


物理 和 巷 (PV) 


物理 分 区 《PPs) 物理 分 区 《PPs) 物理 分 区 《PPs) 


图 2-23 AIX 中 LVM 的 基本 结构 


首先 在 AIX 系统 上 创建 PV， 再 由 一 个 或 多 个 PV 创建 VG， 在 VG 之 上 再 创建 LV， 
所 以 LV 中 的 逻辑 存储 最 终 会 映射 到 PV 上 的 物理 存储 中 。 在 不 使 用 条 和 市 技术 的 情况 下 ， 
LV 上 连续 的 数据 块 会 以 图 2-24 所 示 的 方式 分 布 在 PV 之 上 。 


图 2-24 不 使 用 条 带 技 术 的 情况 


在 使 用 条 带 技术 之 后 ，LV 上 连续 的 数据 块 就 会 以 图 2-25 所 示 的 方式 分 散 地 分 布 在 这 
pV 之 上 。 


图 2-25 使 用 条 带 技术 之 后 的 情况 


这 样 在 对 LV 上 连续 的 数据 进行 读 或 写 的 时 候 ， 就 可 以 实现 同时 在 多 个 PV 上 并 行 地 
处 理 IO 请 求 了 ， 从 而 可 以 极 大 地 提高 IO 的 性 能 。 

上 面 已 经 提 到 的 关于 条 融 深 度 和 条 和 之 宽度 的 特点 在 LV 上 同样 适用 。 只 是 条 带 化 处 理 
的 IO 不 是 发 送 到 物理 磁盘 上 ， 而 是 发 送 到 PV 上 。 在 操作 系统 最 简单 的 存储 方案 中 ，PV 
对 应 的 就 是 物理 磁盘 ， 而 现在 普 过 使 用 了 单独 的 存储 系统 之 后 ，PV 通常 只 是 旬 辑 磁盘 
LUN， 而 这 个 逻辑 磁 人 盘 LUN 通 币 又 是 以 东 种 条 市 化 技术 映射 到 了 存储 系统 中 的 多 个 物理 
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傍 盘 上 。 所 以 在 操作 系统 中 使 用 了 LV 级 别 的 条 带 化 之 后 ， 一 定 要 保证 操作 系统 中 条 带 的 
设置 与 存储 系统 中 条 带 的 设置 相 匹 配 ， 否 则 性 能 将 无 法 得 到 保证 。 

那么 我 们 是 售 需 要 在 使 用 了 存储 系统 条 寓 技 术 的 同时 册 使 用 操作 系统 级 别 的 条 市 技 
术 了 呢 ? 答案 是 : 不 一 定 。 条 和 带 化 技术 的 目的 就 是 最 大 限度 地 将 IO 负载 均衡 ， 实 现 最 大 化 
的 VO 并 行 处 理 。 只 要 有 利于 这 个 目标 ， 我 们 就 可 以 同时 进行 这 两 个 不 同 层次 的 条 融化 。 
相反 ， 如 果 在 同时 使 用 了 这 两 个 层次 的 条 融化 后 并 没有 实现 更 好 的 VO 性 能 ， 那 么 就 没有 
必要 了， 因为 这 进一步 增加 了 LO 结构 的 复杂 性 ， 更 不 利于 存储 空间 的 管理 。 

在 使 用 了 单独 的 存储 系统 之 后 ， 操 作 系 统 级 别 的 条 帝 化 市 给 我 们 最 大 的 性 能 优势 束 是 
LV 上 的 IO 可 以 在 多 个 PV 上 并 行 执行 ， 而 每 个 PV 又 映射 到 不 同 的 一 组 物理 磁盘 上 ， 这 
样 就 可 以 将 LV 上 的 WO 分 布 在 更 多 的 物理 磁盘 上 , 这 对 提高 IO 的 性 能 有 极 大 帮助 。 如 果 
LV 分布 的 多 个 PV 都 映射 到 同一 组 的 物理 磁盘 上 ， 那 么 对 IO 性 能 的 提高 帮助 不 大 。 

在 使 用 了 操作 系统 级 别 的 条 市 化 之 后 ， 还 需要 重点 考虑 的 驶 是 条 融 深 度 ， 操 作 系统 级 
别 条 带 深度 的 大 小 决定 了 问 PV 发 送 IO 的 大 小 。 为 了 获得 最 好 的 性 能 ， 束 要 进一步 地 分 
析 PV 在 映射 到 存储 系统 时 条 和 帝 深 度 的 设置 ， 最 好 的 结果 就 是 : 操作 系统 条 带 深 度 = 存 储 
系统 条 之 深 上 度 X 和 存储 系统 条 之 冤 度 。 这 样 束 能 最 大 限度 地 保证 两 个 层次 条 和 帝 深 上 度 的 罗 配 ， 
从 而 有 最 好 的 IO 性 能 。 

在 操作 系统 中 设置 条 带 化 时 ， 需 要 注意 下 面 的 原则 : 

e 操作 系统 的 条 带 块 的 大 小 设置 大 些 ， 应 该 是 硬件 条 带 块 大 小 的 整数 倍 。 

e 必须 和 应 用 的 特点 相 结合 (例如 ， 应 用 是 随机 读 还 是 连续 读 ， 读 的 块 的 大 小 等 )， 条 

带 技 术 对 大 量 的 顺序 读 / 写 有 最 好 的 IO 性 能 。 

条 市 化 技术 到 目前 为 止 依然 是 提高 VO 性 能 最 好 的 一 种 技术 ， 它 通过 最 大 化 VO 并 行 
特性 发 挥 了 所 有 可 以 利用 的 硬件 的 能 力 ， 所 以 条 这 化 技术 在 各 种 环境 中 都 得 到 了 广泛 的 应 
用 。 我 们 在 考虑 性 能 问题 时 不 可 错过 对 条 市 化 技术 的 关注 。 


2.3 ”逻辑 卷 和 Ivmo 优化 


逻辑 卷 层 位 于 应 用 程序 层 和 物理 层 之 间 。 在 磁盘 IO 的 上 下 文中 ， 应 用 程序 层 是 文件 
系统 或 原始 逻辑 卷 。 物 理 层 由 实际 的 磁盘 组 成 。LVM 是 一 种 AIX 磁盘 管理 系统 ， 可 以 在 
多 辑 和 物理 存储 之 间 英 和 映 数 据 。 这 允许 数据 保存 在 多 个 物理 盘 记 上， 并 使 用 专门 的 LVM 
命令 对 其 进行 管理 和 分 析 。 实 际 上 ，LVM 控制 系统 中 所 有 的 物理 磁盘 资源 ， 并 帮助 提供 
存储 子 系统 的 逻辑 视图 。 

了 解 了 逻辑 卷 层 位 于 应 用 程序 层 和 物理 层 之 间 ， 应 该 可 以 帮助 您 理解 它 为 什么 很 可 能 
是 所 有 层 中 最 重要 的 一 层 。 可 以 说 您 的 物理 卷 本 身 就 是 册 辑 层 的 一 部 分 ， 因 为 物理 层 仪 包 
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含 实 际 的 磁盘 、 设 备 驱动 程序 和 任何 您 可 能 已 经 配置 的 阵列 。 网 2-26 阐释 了 这 个 概念 ， 并 
显示 了 远 辑 LO 组 件 与 物理 磁盘 及 其 应 用 程序 层 是 如 何 紧密 结合 在 一 起 的 。 


Raw 


| 


Logical 
Volume 
Manager 


| 


图 2-26 ”逻辑 卷 示 意图 


现在 ， 让 我 们 简要 地 、 自 底 向 上 地 介绍 LVM 中 的 各 个 元 素 。 每 个 驱动 器 作为 物理 卷 
进行 命名 。 多 个 物理 卷 组 成 郑 组 。 在 疮 组 中 ， 定 义 了 光 辑 人 郑 。LVM 允许 数据 位 于 多 个 物理 
驱动 器 上 , 尽管 可 能 将 它们 配置 为 属于 单个 卷 组 这些 逻辑 卷 可 以 是 一 个 或 多 个 逻辑 分 区 。 
每 个 逻辑 分 区 具有 与 其 相关 联 的 物理 分 区 。 在 其 中 ， 您 可 以 拥有 物理 部 分 的 多 个 副本 以 用 
于 各 种 目的 ， 如 磁盘 镜像 。 


2.3.1 使 用 lvmo 进行 优化 


lvmo 是 AIX Version 5.3 中 首次 引入 的 新 命令 之 一 。lvmo 用 于 设置 和 显示 您 的 pbuf 优 
化 参数 ， 它 还 可 以 用 于 阻 罕 VO 统计 信息 。 请 务必 注意 ， 使 用 lvmo 命令 只 允许 更 改 那 些 专 
门 用 于 特定 卷 组 的 LVM pbuf 可 调 参 数 ，ioo 实用 工具 仍然 是 在 系统 学 围 内 省 理 pbuf 的 唯 
一 方法 。 这 是 因为 ,在 AIX Version 5.3 之 前 , pbuf 池 参 数 是 一 种 系统 范围 的 资源 。 随 着 AIX 
Version $5.3 的 出 现 , LVM 可 以 为 每 个 卷 组 管理 pbuf 池 。 什 么 是 pbuf? 最 准确 地 说 , pbuf 是 
固定 的 内 存 缓冲 区 。LVM 使 用 这 些 pbuf 来 控制 挂 起 的 磁盘 IO 操作 。 

让 我 们 显示 一 下 data2vg 卷 组 的 lvmo 可 调 参 数 : 


# lymo -V data2vg -a 
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vagname = data2vg 

PY POut count 一 T0224 

Lotal vg pbubs = 1024 

max V9 Pbuit count = 81932 

perv blocked 1060 Count 一 7455 
global pbuf count = 1024 
ylobal blocked 10 COuNnG = 71455 


其 中 哪些 是 可 调 参 数 ? 

e pv_pbuf count: 报告 在 将 物理 卷 添加 到 卷 组 时 添加 的 pbuf 数目 。 

e max vg pbuf count: 报告 可 以 为 人 疮 组 分 配 的 最 大 pbuf 量 。 

e global pbuf count: 报告 在 将 物理 卷 添 加 到 任何 郑 组 时 添加 的 pbuf 数目 。 


2.3.2 郑 组 pbuf 池 


通 党 ，LVM 为 每 个 单独 的 IO 请 求 使 用 一 个 pbuf， 而 不 管 传 输 的 数据 量 有 多 大 。 在 问 
VG 添加 新 的 PV 时 ，AIX 创建 了 额外 的 pbuf。 在 以 前 的 AIX 发 布 版 中 ，pbuf 池 是 一 种 系 
统 范围 的 资源 ， 但 是 在 AIX 5L Version 5.3 中 ，LVM 为 每 个 VG 分 配 和 管理 一 个 pbuf 池 。 
对 于 那些 具有 大 量 VG 的 系统 来 说 ， 这 种 增强 可 以 文 持 高 级 的 可 扩展 性 和 性 能 ， 并 且 适 用 
于 所 有 的 VG 类 型 。 因 为 有 了 新 的 pbuf 池 的 实现 ，AIX 可 以 显示 和 管理 附加 的 LVM 统计 
信息 和 调整 参数 。 
lvmo 命令 为 与 新 的 pbuf 池 相 关 的 管理 任务 提供 了 文 持 。 您 可 以 使 用 lvmo 命令 来 显 
示 pbuf 和 阻 千 IO 的 统计 信息 ， 以 及 pbuf 可 调 参数 的 设置 ， 而 不 管 该 实体 的 范围 是 系统 
范围 还 是 VG 特定 的 。 然 而 ，lvmo 命令 只 允许 更 改 专门 用 于 特定 VG 的 LVM pbuf 可 调 
参数 的 设置 。ioo 命令 继续 管理 系统 范围 的 单独 的 pbuf 可 调 参 数 。 为 外 ， 与 以 前 的 AIX 
发 布 版 本 一 样 , vmstat -v 命令 仍 用 于 显示 整个 系统 中 由 于 缺少 空闲 pbuf 而 阻 奢 的 IO 的 
数 [ 日 如 
让 我 们 为 下 面 这 个 疮 组 增加 pbuf 计数 : 
# lvmo -Vv redvg -oO pv pbuf count=2048 
# vmstat -v 
6029312 memory pages 
1/1347/766 lruable pages 
2801540 free pages 
4 memory pools 
406918 pinned pages 


80.0 maxpin percentage 
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20.0 minperm Percentade 
80.0 maxperm percentage 
2.3 numperm percentage 
135417 file pages 
0.0 compressed percentage 
0 compressed pages 
0.0 numclient percentage 
80.0 maxcllient percentage 
0 client pages 
a Temote PadgeouEs scheduled 
312417 pending disk I/Os blocked with no pbuf 
0 paging space I/Os blocked with no psbuf 
2878 filesystem I/0s blocked with no fsbuf 
0 client filesystem I/Os blocked with no fsbuf 
0 external pager filesystem I/Os blocked with no fsbuf 


2.3.3 pbuf 设置 不 合理 导致 性 能 问题 调整 案例 


下 面 我 们 举 一 个 实际 的 案例 。 
客户 应 用 系统 环境 : 

存储 : 日 立 存储 HDS 
操作 系统 : IBM AIX 
数据 库 : DB2 V8.1.9 

多 路 径 通 道 软 件 :， HDLM 


提示 : 

HDLM(Hitachi Dynamic Link Manager) 是 HDS 公司 提供 的 安装 在 主机 端的 存储 通道 传 
输 管理 工具 软件 。HDLM 提供 主机 到 存储 系统 的 IO 通道 负载 平衡 和 故障 切换 功能 ， 增 强 
了 主机 系统 的 数据 可 得 性 。 


问题 描述 : 

2007/09/23: 8 点 10 分 左右 ，CSR SAPR3 节点 ，DB2 数据 库 出 现 挂 起 ， 同 时 操作 系 
统 有 大 量 LVDD 报错 。 
问题 诊断 : 


(1) 从 error log 看 文件 系统 损坏 之 前 ， 发 生 了 什么 事件 。 
D2Al1B43E 0623084108 PUSYSPES FILE SYSTIEM CORRUPITION 
EAS8S8SEFS829 0623081 /7108ITO SYSI2 USER DATALOERROR 
D2Al1B43E 0623081/708 PUSYSPES FILE SYSIEM CORRUPITION 
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613ESF38 0623081708 NULVDD 
A39F8A49 0623081708 TSsyserle ERROR LOGGING BUFFER OVERFLOW 
613ESF38 0623081708 NULVDD 
te se 大 量 的 LVDD 错误 
613ESF38 0623081708 NULVDD 
613ESF38 0623081708 NULVDD 
en Ss 大 量 的 LVDD 错误 
613ESF38 0623081708 NULVDD 
613ESF38 0623081708 NULVDD 
pe . Ss 大 量 的 LVDD 错误 
613ESF38 0623081708 NULVDD 
613ESF38 0623081708 NULVDD 
0 ee 大 量 的 LVDD 错误 
613ESF38 0623081708 NULVDD 
0EC00096 0623081708 PUSYSPFS STORAGE SUBSYSTEM FAILURE 
<<< Jun 23 08:17:31 JFS META EXCEPTION 
A39F8A49 0623081708 TSsyserle ERROR LOGGING BUFFER OVERFLOW 
52715FAS 0623081708UHLVDD FAILED TO WRITE VOLUME GROUP 
STATUS AREA ”<<< Jun 23 08:17:30 更 新 VGSA 失败 
613ESF38 0623081708 NULVDD 
613ESF38 0623081708 NULVDD 
ee ee 大 量 的 LVDD 错误 
613ESF38 0623081708 NULVDD 
613ESF38 0623081708 NULVDD 
ce 大 量 的 LVDD 错误 
613ESF38 0623081708 NULVDD 
a i 大 量 的 LVDD 错误 
613ESF38 0623081708 NULVDD 
613ESF38 ”0623081708 NULVDD ”<< Sep 23 08:17:39 LVDD 错误 
3074FEB7 0623081608 TH fscsi0 ADAPTER ERROR 
3074FEB7 0623080908 TH fscsil ADAPTER ERROR 


<< Sep 23 08:09:38 FSCSI ERR4 错误 


B8FBD189 


0623080908 TS fscsil SOF [WARE PROGRAM ERROR 
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<< Sep 23 08:09:38 FSCSI ERR6 错误 
A63BEB70 “0621011608N U SYSPROC 
(2) 文件 系统 损坏 之 前 发 生 的 事件 过 程 如 下 : 
08:09:38 HBA 卡 到 光纤 交换 机 的 通信 临时 中 断 ， 发 生路 径 切 换 。 
08:17:30 ”产生 LVDD 错误 ，AIXLVM 的 VO 请 求 无 法 完成 。 
指向 的 设备 是 : dmfdrv109 00clef4b81ac62f2 ocrvgll 
08:17:30 ”更 新 VGSA 失败 
指 问 的 设备 是 : 


brw-r--r-- 1 root system 42.181 Jun 16 01:39 dlmfdrv180 
dlmfdrv]180 00c19d3b542ae30b ocrvg01 active 
08:17:31 JFS META EXCEPTION，LVM 在 谈 取 正 S 文件 系统 的 meta data 时 产 
生 LIO 错 误 。 
#define EIO 5 /LOerror yf 


(3) 分 析 有 具体 原因 。 

HBA 卡 到 光纤 交换 机 通信 中 断 ，error log 记 录 的 原因 是 4E。 

Errmno 4E = EITIMEDOUT 

原因 如 下 : 

AIX LVM 发 送 给 HDLM 的 IO 请 求 , 因为 HDLM 的 参数 hd pbuf cn 到 达 了 上 限 而 失 
败 。 如 果 hd pbuf cn 到 达 了 了 上限， 我 们 束 会 在 error log 中 看 到 大 量 的 lvdd Error NONE 
(613E5F38)。hd_ pbuf cn 这 个 参数 的 合理 值 为 65536， 在 AIX 5$.3 中 ， 与 hd_ pbuf cn 相关 
的 参数 是 max ve pbuf count 和 hd pbuf cnt。 

hd pbuf cnt 和 在 AIX 5L Version 5.3 中 的 max ve pbuf count 有 如 下 限制 : 并 发 IO 请 
求 的 最 大 数量 的 允许 值 是 从 16384 到 1000000。 默 认 值 是 16384。 

9 月 23 日 ，SAPR3 的 HDLM 的 pbuf count 设 置 值 如 下 ; 

root@SAPR3:/> /usr/DynamicLinkManager/bin/dlmodmset -o 


Inquiry Log : on 
Ingquiry Log Fileé Size : 1000 
hdisk error check flag : bff 
HDLM pbuf count -116.3284 
Lun Reset - OII 


KAPL10800-I The dlmodmset utility completed normally. 
root@sSAPR3:/> 


诊断 结论 : 
在 问题 出 现 前 ，CSR 系 统 做 了 系统 变更 (通过 LVM mirror 做 了 数据 保护 ) 和 业务 操作 (正在 


做 数据 库 恢复 )， 这 些 部 增加 了 并 发 与 VO 的 量 。 我 们 得 到 这 样 的 分 析 结 末 : 业务 的 变化 
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使 CSR 系 统 SAPR3 贡 点 的 并 发 IO 数量 大 大 增加 ， 达 到 了 HDLM 参 数 hd pbuf cn 设置 的 上 
限 16384， 导 致 LVM 送 达 HDLM 的 IO 失败 ， 包 括 更 新 VGSA 及 文件 系统 meta 的 IO 操作 
也 同时 失败 ， 造 成 卷 组 中 stale pp 的 产生 和 文件 系统 的 损坏 。 
调整 建议 : 

e 增 大 HDLM pbuf count 的 值 为 65536。 

e 同时 相应 增 大 操作 系统 与 之 对 应 的 max ve pbuf count 参数 值 到 65536。 
调整 步 又 : 

方法 : 

(1) 增 大 VG 的 pbufs 

(2) max ve pbuf count -max pbufs avallabjle for the VGs, requires varyon/varyotf 


# lvmo -v <vename> -0 max VE pbuf count=<new value> 


步 又 :需要 对 如 下 vg 进行 调整 


ocrve02 
ocrve01 
(3) lvmo -v ocrvg01 -o max ve pbuf count=65536 
(4) varyofivg ocrvg01] 
(3) varyonveg ocrve01 
(6) lvmo -Vv ocrvg02 -o max ve pbuf count=653536 
(7) varyoffveg ocrve02 
(8) varyonveg ocrve02 
为 使 更 新 生效 ， 需 要 重新 配置 HDLM driver 或 重新 启动 系统 。 
调整 效果 : 
经 过 上 述 调整 ， 该 系统 的 IO 否 吐 量 加 大 ， 在 业务 相同 的 情况 下 连续 观察 儿 天 没有 
下 出 现 类 似 的 错 认 。 同 时 性 能 也 大 大 提 闹 。 


从 上 面 这 个 案例 中 ， 我 们 可 以 看 到 ， 造 成 系统 出 现 铬 误 的 主要 原因 是 操作 系统 层面 郑 
组 的 pbuf 和 存储 层面 hd puf cn 的 “边界 ”配合 出 现 问 题 。 所 以 希望 大 家 通过 这 个 案例 能 
对 存储 层面 和 操作 系统 的 性 能 调整 有 更 深入 的 了 解 。 


2.3.4 使 用 ioo 进行 优化 
表 2-1 列 出 了 一 些 特定 的 优化 参数 ， 通 过 调整 这 些 参 数 可 以 所 高 IO 性 能 。 


59 


60 


DB2 数据 库 性 能 调整 和 优化 (第 3 版 ) 


表 2-1 


设置 缓存 的 内 存 限制 ( 便 
限制 ) 


设置 用 于 提前 顺序 读 取 的 
最 大 页 面 数 


特定 的 优化 参数 


100 -0 maxpgahead=value 


功 能 JFS 优化 参数 
设置 缓存 文件 的 最 大 内 存 
Ar EL ViINO -0 maxperm=value 
他 里 
放 下 细 用 他 文 作 的 如 小 站 仔 Wi -0 minperm=—value 
容量 
oie 


dd et 100 -0 minpgahead 
最 小 页 面 数 pgahead 


设 前 对 于 文件 的 挂 起 与 IO 
的 最 大 数目 

设 前 对 于 文件 的 挂 起 与 IO 
的 最 小 数目 ， 在 此 情况 下 ， 
由 maxpout 阻塞 的 程序 可 
以 继续 


使 用 随机 写 操 作为 文件 设 


maxpout 


minpout 


100 -0 maxrandwrt=value 


置 修改 数据 缓存 的 容量 
为 延迟 的 顺序 写 操作 控制 


100 -0 numclust—value 


LO 的 收集 
说 置 f/s bufstruct 的 数目 


100 -oO numtfsbufs=value 


chhdev -] sys0 -a maxpout 


chdev -| sys0 -a mimpout 


增强 的 JFS2 优化 参数 


vmo -0 maxclient=value( 小 本 或 等 本 


maxperm) 


不 适用 


vmo -0 maxclient( 便 限制 ) 


100 -0 ]2 maxPageReadAhead=value 


100 -0 ]2 minPageReadAhead=value 


chdev -] sys0 -a maxpout maxpout 


chdev -] sys0 -a minpout minpout 

100 -0 ]2 maxRandomW1ite 100 -0]2 
nRandomC luster 

100 -0 ]2 nPagesPerWriteBehindCluster=value 


100 -0 ]2 nButftferPerPagerDevice=~value 


您 可 以 使 用 几 种 不 同 的 方式 来 确定 系统 中 现 有 的 ioo 值 。ioo 的 显示 清单 很 长 ， 其 中 清 


蜥 地 提供 了 大 部 分 信息 。 已 多 加 
的 所 有 可 调整 参数 的 依赖 关 


-Ao 


0 1 

NAME, CUR DEF BOOT MIN 
]2 atimeUpdatesSymlink 0 0 
2 vnamicBiiferereallo 16 16 
400 400 
128 129 


]2 inodeCacheSsize 
J]2 maxPageReadAhead 


了 当前 值 、 重 新 启动 值 、 


范围 、 单 位 、 类 型 和 由 ioo 管理 


UNIT TY Bi DEPENDENCIES 
0 1 boolean D 
0 256 16K slabs D 
1 1000 D 
0 GA4K 4KB pages D 
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]2 maxRandomWrite 0 0 0 0 64K 4KB pages D 
]2 maxUsableMaxTransfer 512 512 JI12 1 4K pages M 
]2 metadataCacheSsize 400 400 400 1 1000 D 
]2 minPageReadAhead 2 2 2 0 64K 4KB pages D 
]2 nBufferPerPagerDevice 512 512 512 512 256K M 
]2 nPagesPerWriteBehindC 32 32 2 0 64K D 
]2 nRandomCluster 0 0 0 0 64K 16KB clusters D 
]2 nonFatalCrashesSsystem0 U 0 0 | boolean D 
]2 syncModifiedMapped 1 1 中 0 1 boolean D 
]2 SyncdLogSYTnCInterval 1 1 0 A4K iterations D 
Jfs clread enabled 0 0 0 D 1 boolean D 
Jfs use read lock 1 1 1 0 ] boolean D 
lvm bufcnt 9 9 3 1 b4 128KB/buffer D 
maxpgahead minpgahead 8 8 8 0 4K 4KB pages D 
maxrandwrt 0 0 0 0 312K 4KB pages D 
memory frames I12K | 4KB pages 本 
Minpgahead maxpgahead 2 二 2 0 4K 4KB pages D 
numclust | I [I 0 2G—1 1]16KB/cluster D 
numfsbufs 9 .L356 196 1 2 M 
pd npages 64K 64K 64K 1 J12K 4KB pages D 
pgahd Scale thresh 0 0 0 0 419430 4KB pages D 
pv min pbuf la nl 本 二 交 jl2 | D 
sync release 1ilock 0 0 0 0 1 boolean D 


n/a means parameter not supported by the current platform or kernel 
Parameter types: 

S = Static: cannot be changed 
= DYnamlc : 
= Bosboot: 
= Reboot: can only be changed during reboot 


Can be Treely changed 

can only be changed using bosboot and reboot 
Connect: changes are only effective for future socket connections 
= Mount: changes are only effective for future mountings 

= Incremental: can only be incremented 


各 届 全 风口 
| 


= _ deprecated: deprecated and cannot be changed 
下 面 的 代码 同 您 显示 了 如 何 更 改 可 调整 的 参数 : 


100 -oO maxpgahead=32 
Setting maxpgahead to 32 


上 面 这 个 参数 仅 用 于 下 S。 接 下 来 的 部 分 将 适用 于 正 S2。 
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些 重 要 的 、 正 S2 特定 的 文件 系统 的 性 能 增强 功能 包括 ， 提 前 顺序 页 面谈 取 和 延迟 顺 
序 、 随 机 写 入 ,通过 观察 文件 的 访问 模式 , AIX 的 虚拟 内 存 管 理 器 (Virtual Memory Manager， 
VMM) 可 以 预测 页 面 需求 。 当 程序 访问 文件 的 两 个 页 面 时 ，VMM 假定 该 程序 将 采用 顺序 
的 方法 不 断 地 尝试 访问 该 文件 。 可 以 使 用 VMM 效 值 来 配置 将 要 提前 读 取 的 页 面 数目 。 对 
于 正 S2， 记 录 以 下 两 个 重要 参数 : 
e j2 minPageReadAhead: 用 于 确定 当 VMM 最 初 检 测 到 顺序 模式 时 提前 谈 取 的 页 面 
e ]2 maxPageReadAhead: 用 于 确定 VMM 可 以 在 顺序 文件 中 谈 取 页 面 的 最 大 数量 。 


1. 文件 同步 性 能 调 优 


JFS 的 非 顺序 文件 IO 会 一 直人 存储 在 内 存 中 ， 直 到 满足 一 定 条 件 : 

e 宇 亲 列 表 缩 小 到 minffee， 以 至 于 需要 进行 页 替换 。 

e Syncd 守护 程序 按 固 定 调度 间隔 刷新 页 。 

e 执行 了 sync 命令 。 

e 在 达到 参数 j2 maxRandomwrite 设置 的 阔 值 后 ， 会 启用 内 存 中 的 脏 页 。 

如 果 在 以 上 的 任 一 条 件 满足 前 已 存储 了 过 多 页 ， 那 么 在 syncd 守护 程序 进行 刷新 时 ， 
会 获得 i-node 锁 ， 并 保持 到 有 所 有 的 脏 页 面 都 被 写 入 磁盘。 在 这 段 时 间 里 ， 任 何 试图 访问 此 
文件 的 线程 会 由 于 无 法 获得 i-node 锁 而 被 阻塞 。 请 记 住 :syncd 守护 程序 会 顺利 地 刷新 文 
件 中 的 所 有 及 页 面 ， 但 限于 一 次 一 个 文件 。 在 拥有 大 量 内 存 并 同时 有 大 量 页 需要 修改 的 系 
统 中 ， 在 syncd 守护 程序 刷新 页 时 ，LO 可 能 达到 高 峰值 。 

AIX 含有 名 为 sync release jlock 的 可 调 选 项 。ioo 命令 加 上 -o sync release ilock=] 选 
项 允许 在 清空 该 文件 的 脏 员 和 面 后 释放 inode 锁 。 这 一 选项 使 得 在 调用 syncO 的 过 程 中 访问 
该 文件 有 更 好 的 啊 应 。 

阻 徐 效果 也 可 通过 在 syncd 守护 程序 中 提高 同步 疾 率 使 乙 最 小 化 。 更 换 用 于 司 用 syncd 
守护 程序 的 /sbin/rc.boot， 然 后 重新 引导 系统 使 之 生效 。 对 现行 系统 ， 杀 死 syncd 守护 程序 
进程 并 按 新 的 值 重 新 局 动 守 护 程序 。 


2. 文件 系统 缓冲 区 调 优 
以 下 ioo 参数 可 用 于 调 优 磁盘 L/O: 


numfsbufs 参数 

当 有 大 量 针 对 文件 系统 的 同步 或 大 型 IJO， 或 是 存在 针对 文件 系统 的 大 型 顺序 IO 时 ， 
这 些 IO 可 能 会 在 等 每 bufstruct 时 成 为 文件 系统 级 的 瓶颈 。 每 个 文件 系统 的 bufstructs 数 
目 ( 称 为 numfsbufs) 可 使 用 ioo 命令 增加 。 访 值 仅 在 文件 系统 加 载 后 才 会 生效 ， 因 此 ， 如 末 
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更 改 了 这 个 值 ， 束 必须 好 载 ， 然 后 再次 加 载 文件 系统 。numfsbufs 默认 每 个 文件 系统 有 93 


个 bufstruct。 


j2_nBufferPerPagerDevice 参数 

在 增强 型 正 S 中 ，bufstruct 的 数量 由 参数 ]2 _ nBufferPerPagerDevice 指定 。 当 前 增强 
型 JFS 文件 系统 的 默认 bufstruct 数 是 512。 每 个 增强 型 JES 文件 系统 的 bufstructs 数 
(02_nBufferPerPagerDevice) 可 以 使 用 ioo 命令 来 增加 。 该 值 在 文件 系统 被 加 载 后 才 起 作用 。 


lvm_bufcnt 参数 
如 果 应 用 程序 正在 处 理 大量 的 裸 IO 而 不 通过 文件 系统 ， 同 文件 系统 相同 类 型 的 瓶 觅 
也 可 能 出 现在 LVM 层 上 .。 极 大 量 的 IO 加 上 极 快 的 IO 设备 可 能 会 导致 LVM 层 上 的 瓶 癸 。 
但 是 如 果真 的 出 现 瓶 绒 ， 那 么 可 以 通过 ioo 命令 增加 lvm bufcnt 参数 来 提供 大 量 的 
“uphysio” 绥 冲 区 。 该 值 会 立刻 生 效 。 当 前 的 默认 值 是 9 个 “uphysio” 绥 冲 区 。 由 于 当前 
LVM 将 LO 分 为 每 个 128KB， 而 lvm bufcnt 的 默认 值 为 9， 故 一 次 可 写 入 9*128KB。 如 
果 正 在 进行 的 VO 大 于 9*128 KB， 增 加 lvm_ bufcnt 的 值 才 会 有 利 。 


hd pbuf_cnt 参数 

hd_ pbuf cnt 参数 控制 可 用 于 LVM 设备 驱动 程序 的 pbufs 数 。pbuf 是 用 于 存放 和 暂 挂 于 
LVM 层 的 IO 请 求 的 国定 内 存 缓冲 区 。 

在 AIX 中 ， 顺 序 VO 的 结合 使 得 无 论 IO 包括 多 少 页 ， 每 个 顺序 IO 请 求 只 使 用 单个 
pbuf。 这 种 类 型 的 瓶 锋 一 般 很 难过 到 。 而 对 于 随机 IO， 除非 运行 syncd 守护 程序 ，LIO 一 

确定 是 否 发 生 pbuf 眶 人 锋 的 最 好 方法 是 检查 被 称 为 hd pendqblked 的 LVM 变量 。 以 下 
代码 会 给 出 该 变量 的 值 : 


#!/bin/ksh 

# requires root authority to run 

# determines number of times LVM had to walt on pbufs since system boot 

addr="'echo "knlist hd pendgqblked™ | /usr/sbin/crash 2>/dev/null |tail -1| 
Ca 

value "echo "od Saddar 1 BD™ | /usr/sBbIin/erash 2>/dev/null | tarl ~1|1 cut £2 

de 
echo "Number of walts on LVM pbufs are: $value" 
exit 0 


ioo -a 命令 也 可 以 显示 hd pendqblked 值 。 
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注意 : 

请 不 要 把 hd pbuf cnt 的 值 设 得 太 大 ， 因 为 除了 重新 引导 系统 外 无 法 减 小 该 值 

pd_npages 参数 

pd_npages 参数 指定 当 删 除 文件 时 RAM 的 菏 一 块 中 应 该 删除 的 页 数 。 改变 该 值 只 对 屠 
些 需 要 删除 文件 的 实时 应 用 程序 有 用 。 由 于 在 分 派 茶 个 进程 / 线程 之 前 将 删除 少量 的 页 面 ， 
因此 通过 减 小 pd_npages 参数 的 什 ， 实 时 应 用 程序 可 获得 更 快 的 啊 应 时 间 。 默 认 什 是 最 大 
可 能 文件 大 小 除 以 页 面 大 小 (目前 为 4096); 如 果 最 大 可 能 文件 大 小 为 2GB, 那么 pd_npages 
参数 的 人 默认 为 524288。 


vV_pinshm 参数 
当 Vv pinshm 参数 设置 为 1 时， 如 果 执 行 shmsetO 的 应 用 程序 指定 SHM PIN 作为 标志 
物 一 部 分 ， 就 会 使 共享 内 存 段 中 的 页 面 由 VMM 固定 。 默 认 值 为 0。 


fsbufwaitcnt 和 psbufwaitcnt 计数 器 

只 要 bufstruct 变 得 不 可 用 以 及 VMM 将 线程 放 入 VMM 等 每 列表 中 ，fsbufwaitent 和 
psbufwaitcnt 计数 占 束 会 递增 。 使 用 crash 命令 或 ioo -a 命令 的 fsbufwaitcnt 和 psbufwaitcnt 
选项 来 检查 这 些 计 数 器 的 值 。 下 面 是 输出 示例 : 

# lioo -a 

hd pendoqblked = 3035 

psbufwaitcnt = 0 


fsbufwaitcnt = 337 
xpagerbufwaitcnt 计数 间 


只 要 增强 型 FS 文件 系统 上 的 bufstruct 不 可 用 , xpagerbufwaitcnt 就 会 递增 ,可 使 用 ioo 
-a 命令 检查 xpagerbufwaitcnt 计数 占 的 值 。 下 面 是 输出 示例 : 


HL 
xpagerbufwaitcnt = 815 


2.4 操作 系统 性 能 调整 总 给 


在 应 用 系统 出 现 性 能 问题 时 ， 操 作 系 统 是 我 们 定位 问题 的 入 口 ， 它 在 整个 应 用 系统 中 
起 到 承 上 局 下 的 作用 。 我 们 首先 要 通过 操作 系统 定位 性 能 瓶颈 ， 然 后 才能 展开 下 一 步 的 调 
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整 工 作 。 同 时 ， 在 操作 系统 上 也 有 很 多 可 以 优化 的 地 方 ， 例 如 LO 访问 方式 、 条 市 化 ， 以 
及 相关 逻辑 卷 配 置 参 数 等 都 可 以 通过 合理 调整 来 提高 应 用 系统 的 性 能 。 


2.5 ”存储 1/O 设计 


对 于 任何 程序 的 运行 来 说 ， 最 慢 、 最 花费 时 间 的 操作 实际 上 是 从 磁盘 中 检索 数据 。 这 
主要 缘 于 磁盘 IO 访问 中 存在 的 物理 机 械 过 程 (磁头 旋转 和 寻 道 )。 尺 管 磁盘 存储 技术 在 最 
近 几 年 取得 了 极 大 的 进步 ， 但 磁盘 的 旋转 速度 却 没有 太 大 的 提高 。 您 必须 清楚 这 样 一 个 事 
实 : 在 一 定 条 件 下 ，RAM 访问 仅仅 需要 大 概 540 个 CPU 时 钟 周 期 ， 而 磁盘 访问 则 需要 
花费 大 概 20 000 000 个 CPU 时 钟 周期 。 很 明显 ， 系 统 中 访问 数据 最 薄弱 的 环节 就 是 磁盘 
LO 存储 系统 ， 从 性 能 调整 的 角度 来 说 ， 就 是 确保 磁盘 数据 布局 不 会 成 为 更 严重 的 瓶颈 。 
糟糕 的 数据 布局 将 会 给 IO 性 能 带 来 更 大 的 影响 。 在 对 系统 进行 任何 优化 活动 之 前 ， 首 先 
应 该 了 解 您 的 存储 IO 系统 的 物理 体系 结构 ， 因 为 如 果 您 所 设计 的 存储 IO 系统 非常 糟 
糙 ， 并 且 其 中 包含 慢 速 磁盘 ， 或 者 适配器 的 使 用 非常 低 效 ， 那 么 其 他 的 任何 优化 工作 都 无 
法 提供 帮助 。 所 以 恨 好 的 存储 IO 设计 对 于 系统 性 能 的 提升 是 很 显著 的 。 


2.6 存储 基本 概念 


关于 和 存储 的 概念 太 多 ， 许 多 已 经 超出 了 本 书 的 讨论 范围 。 本 章 主 要 讲解 最 肖 见 的 儿 个 
概念 ， 它 们 是 我 们 进行 存储 VO 设计 所 必须 和 擎 握 的 。 


2.6.1 硬盘 


硬盘 处 于 整个 存储 系统 的 最 底层 ， 核 心 的 业务 数据 通常 都 存放 在 硬盘 上 。 我 们 从 硬盘 
上 读 取 一 次 LO 要 花费 的 时 间 如 下 : 
便 熏 上 一 次 IO 时 间 = 磁 可 寻 道 时 间 + 人 磁头 旋转 到 特定 届 区 时 间 + 传 输 时 间 + 延 迟 
图 2-27 所 示 的 硬盘 VO 传输 图 中 标识 了 磁头 在 不 同位 置 的 寻 道 时 间 。 衡 量 磁盘 的 IO 
能 力 有 如 下 几 个 指标 : 
e 便 盘 的 转速 Rotational Speed): 也 就 是 人 硬盘 电机 主轴 的 转速 ， 转 速 是 决定 价 盘 内 部 
传输 率 的 关键 因素 乙 一 ， 它 的 快慢 在 很 大 程度 上 影响 了 硬盘 的 速度 。 同 时 ， 转 速 
的 快慢 也 是 区 分 硬盘 档次 的 重要 标志 之 一 。 人 硬盘 的 主轴 马达 市 动 盘 片 高 速 旋 转 ， 
产生 浮力 使 磁头 圣 浮 在 盘 片 上 方 。 要 将 所 要 存 取 资料 的 忆 区 市 到 磁头 下 方 ， 转 速 
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越 快 ， 等 竺 时间 也 束 越 短 。 因 此 ， 转 速 在 很 大 程度 上 决定 了 硬盘 的 速度 。 目 前 市 
场 上 常见 的 硬盘 转速 一 般 有 $400rpm、7200rm 和 15000mm。 理 论 上 ， 转 速 越 快 
越 好 ， 因 为 较 高 的 转速 可 缩短 硬盘 的 平均 寻 道 时 间 和 实际 恋 写 时 间 。 但 是 转速 越 
快 发 热量 越 大 ， 不 利于 散热 。 现 在 的 主流 硬盘 转速 一 般 为 15000rpm 以 上 。 


Maximum seek: head move 
from 1st cylinder to last cylinder 

Maximum seek 
Average seek: the mean time 
head move across 


cylinders Average seek 


| : 


t 


IH 

Wu 
| (NN 
Minimum seek: head move AS 
| MiNIMUM Seek 一 . WW NNN 、 

one cylinder SS 


Average Latency: time takes for platter to 
spin half round 


(也 就 是 磁 登 旋转 半 圈 所 再 要 耗费 的 时 间 ) 


图 2-27 ”磁盘 LO 传输 图 


e 平均 寻 道 时 间 (Average Seek Time): 指 便 盘 在 盘面 上 移动 谈 与 头 全 指定 厂 道 寻找 相 
应 目标 数据 所 用 的 时 间 ， 筷 摘 述 硬盘 谈 取 数据 的 能 力 ， 单 位 为 塞 秒 。 当 单 代 卢 容 
量 增 大 时 ， 磁 头 的 寻 道 动作 和 移动 距离 减少 ， 从 而 使 平均 寻 道 时 间 减 少 ， 加 快 硬 
盘 速 度 。 

e 平均 延迟 时 间 (Average Latency Time): 指 当 磁头 移动 到 数据 所 在 的 磁道 后 , 然后 等 
符 所 要 的 数据 块 继续 转动 到 磁头 下 所 用 的 时 间 。 

e 平均 访问 时 间 (Average Access Time): 指 磁头 找到 指定 数据 的 平均 时 间 ， 通 向 是 平 
均 寻 壹 时 间 和 平均 延 人 运 时 间 之 和 。 平 均 访 问 时 间 最 能 够 代表 便 盘 找到 菏 一 数据 所 
用 的 时 间 ， 越 短 的 平均 访问 时 间 越 好 。 

为 什么 要 讲 便 盘 呢 ?因为 DB2 数据 库 在 工作 时 , 一 条 SQL 语句 在 经 过 优化 器 编译 时 ， 
优化 堪 会 谈 取 统计 人 信息、 数据 库 配 置 参数 和 相关 便 件 信息 来 为 该 条 SQL 语句 生成 最 优 的 执 
行 计 划 。 其 中 的 硬件 信息 包括 表 空 间 的 transrate 和 overhead。 这 两 个 参数 的 计算 就 是 由 全 
盘 的 相关 属性 来 决定 的 。 它 们 的 计算 公式 如 下 : 
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transrate=(]1/ 传 送 速率 )*1000/1024000*4096( 假 设 用 4KB 页 大 小 ) 

overhead= 平 均 寻 道 时 间 +(((] /磁盘 转速 )#*60*1000)/2) 

而 平均 寻 道 时 间 、 磁 盘旋 转速 度 和 传送 速率 是 由 硬盘 本 身 决定 的 ， 所 以 我 们 必须 合理 
地 进行 存储 IO 设计 以 使 优化 器 更 好 地 工作 。 


2.6.2 ”磁盘 阵列 技术 


RAID 的 全 称 是 独立 磁盘 几 余 阵列 (Redundant Array of Independent Disk)。 它 通过 将 多 
个 相对 比较 便宜 的 磁盘 组 合 起 来 ， 并 相互 连接 ， 同 时 都 连 到 一 个 或 多 个 计算 机 上 ， 组 成 磁 
熏 组 ， 从 而 使 性 能 和 容量 达到 或 超过 价格 更 昂贵 的 大 型 磁盘 。20 年 来 ，RAID 推出 了 一 系 
列 级 别 ， 包 括 RAID 0、RAID 1、RAID 2、RAID 3、RAID 4、RAID 5， 以 及 各 种 组 合 ( 比 
如 RAID 1+0 等 )， 其 中 应 用 最 广泛 的 是 RAID5 和 RAID 1+0。 


RAID 1+0 
RAID 0 能 提供 更 好 的 性 能 , RAID-1 能 提供 最 佳 的 数据 你 护 。 如 琳 把 两 痢 结合 在 一 起 ， 
束 能 同时 提供 局 性 能 和 数据 保护 ， 但 这 也 会 同时 提高 磁盘 阵列 造价 。 


RAID > 

RAID 5 不 做 全 磁盘 镜像 ， 但 它 会 对 每 一 个 写 操作 做 奇偶 校 验 计算 并 写 入 奇偶 校 验 数 
据 。 奇 偶 校 验 磁盘 避免 了 像 RAID 1 那样 完全 重复 写 数据 。 当 磁盘 失效 时 ， 校 验 数 据 被 用 
来 重建 数据 ， 从 而 保证 系统 不 会 崩溃 。 为 避免 磁盘 瓶 项 ， 奇 偶 校 验 和 数据 都 会 被 分 布 到 阵 
列 中 的 各 个 磁盘 。 尽 管 读 的 效率 提高 了 ， 但 是 RAID 5 需要 为 每 个 写 操作 做 奇偶 校 验 ， 因 
此 它 的 写 效率 很 差 。 


2.6.3 ”存储 的 Cache 


局 问 存 储 系 统 中 除了 要 有 局 性 能 、 忆 扩展 性 的 结构 外 ，Cache 的 设计 将 卫 接 影响 到 存 
储 系统 的 性 能 表现 和 可 菲 性 。 

Cache 的 主要 作用 是 什么 呢 ? 作为 缓存 , Cache 的 作用 具体 体现 在 读 与 写 两 个 不 同 的 方 
面 : 作为 号， 一 般 存储 阵列 只 要 求 数据 写 到 Cache 就 算 完 成 了 写 操作 。 当 写 Cache 的 数据 
积累 到 一 定 程度 ， 阵 列 才 把 数据 刷 到 和 磁盘， 这 样 可 以 实现 批量 号 入 。 所 以 ， 阵 列 的 写 是 非 
常 快速 的 。 至 于 Cache 数据 的 保护 ， 一 般 都 依赖 于 镜像 与 电池 (或 是 UPS)。 

Cache 在 读数 据 方面 的 作用 同样 不 可 和 忽视， 因为 如 果 所 要 读 取 的 数据 能 在 Cache 中 命 
中 的 话 ， 将 大 大 减少 磁盘 寻 道 所 需要 的 时 间 。 因 为 磁盘 从 开始 寻 道 到 找到 数据 ， 一 般 都 在 
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6ms 以 上 , 而 这 个 时 间 , 对 于 那些 密集 型 VO 的 应 用 可 能 不 是 太 理 想 。 但 是 , 如 果 能 在 Cache 
保存 的 数据 中 命中 ， 一 般 啊 应 时 间 则 可 以 缩短 在 lms 以内。 存储 的 Cache 大 小 对 整个 IO 
性 能 的 影响 是 非常 大 的 。 


2.6.4 网 络 存 储 技术 


FC SAN(Storage Area Network， 存 储 区 域 网 ) 是 高 速 的 子 网 ， 这 个 子 网 中 的 设备 可 以 从 
您 的 主 网 卸载 流量 。 通 常 ，SAN 由 RAID 阵列 连接 光纤 通道 (Fibre Channel) 组 成 ，SAN 同 
服务 融和 客户 机 的 数据 通信 和 是 通过 SCSI 命令 而 非 TCP/P 实现 的 ， 数 据 处 理 是 “ 块 级 ” 
(block levejl)。 

SAN 通过 特定 的 互联 方式 连接 奢 干 台 和 存储 服务 句 而 组 成 单独 的 数据 网 络 , 提供 企业 级 
的 数据 存储 服务 ， 如 图 2-28 所 示 。 SAN 是 一 种 特殊 的 高 速 网 络 ， 连 接 网 络 服务 器 和 诸如 
大 磁盘 阵列 或 备份 磁带 库 的 存储 设备 ，SAN 置 于 LAN 之 下 ， 而 不 涉及 LAN。 利 用 SAN， 
不 仅 可 以 提供 大 容量 的 存储 数据 ， 而 且 地 域 上 可 以 分 人 履 ， 缓 解 了 大 量 数据 传输 对 局 域 网 的 
影响 。SAN 的 结构 允许 任何 服务 堪 连 接 到 任何 存储 阵列 ， 不 管 数 据 存 放 在 哪里 ， 服 务 堪 都 
可 直接 存 取 所 需 的 数据 。 
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图 2-28 SAN 存储 示意 图 


NAS 是 Network Attached Storage( 网 络 附 加 存储 ) 的 人 简称。 在 NAS 存储 结构 中 ， 和 存储 系 
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统 不 下 通过 LO 总 线 附 属于 茶 个 服务 需 或 客户 机 , 而 是 直接 通过 网 络 接口 与 网 络 和 直接 相连 ， 
由 用 户 通 过 网 络 访问 。NAS 是 连接 到 计算 机 网 络 的 文件 层 的 数据 存储 ， 可 以 为 不 同 网 络 的 
客户 帆 提 供 数据 存储 服务 。NAS 的 价 件 与 传统 的 专用 文件 服务 占 相 似 ， 它 们 的 不 同 点 在 于 
软件 靖 。NAS 中 的 操作 系统 和 其 他 软件 只 提供 数据 存储 、 数 据 访 问 功能 ， 以 及 对 这 些 功 能 
的 管理 。 与 传统 以 服务 器 为 中 心 的 存储 系统 相 比 ， 数 据 不 冉 通过 服务 坪 内 存 转发 ， 而 是 直 
接 在 客户 机 和 存储 设备 间 传 送 ， 服 务 融 仅 起 控制 管理 的 作用 。 

SAN 和 NAS 的 对 比如 表 2-2 所 示 。 


对 比 因 素 


连接 介质 
传输 协议 
数据 传输 类 型 
数据 传输 速率 
集群 应 用 支持 
数据 库 支持 


表 2-2 SAN 和 NAS 的 对 比 

SAN NAS 
SCSI 或 光纤 网 络 线 级 
FCP( 和 光纤 通道 协议 ) TCP/IP 


SCSI 数据 块 文件 级 
较 低 
好 | 关 


2.7 ”存储 染 构 


2.7.1 存储 |/O 处 理 过 程 


了 解 典 型 的 IO 流动 图 对 于 我 们 定位 IO 性 能 瓶颈 是 非 间 重要 的 。 下 面 我 们 来 看 下 典 
型 的 IO 流动 图 ， 如 图 2-29 所 示 。 


Storage 


Core 
System 


Edge Directors 
Switches 


The IO starts and ends here 


图 2-29 ”典型 的 DLO 流动 图 
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提示 : 

Core Directors 可 以 智能 化 地 自动 实现 负载 平衡 和 流量 控制 。 在 LO 处 理 过 程 中 ， 要 保 
证 HBA 卡 的 网 络 带 宽 、 光 交换 机 端口 带宽 、 存 储 的 前 端 端口 、 后 端 端口 的 速度 匹配 。 不 
要 因为 某 个 瓶颈 而 导致 “ 木 桶 效应 ”。 


2.1.2 RAID IOPS 


IOPS 即 IO Per Second,， 也 就 是 磁盘 每 秒 进 行 谈 写 IIUO) 操 作 的 次 数 ， 决 定 IOPS 的 主要 
因素 在 于 阵列 的 算法 、Cache 命中 率 以 及 磁盘 个 数 。 阵 列 的 算法 会 由 于 阵列 的 不 同 而 不 同 ， 
例如 在 hds usp 上 和 而, 可 能 因为 ldev(dlum) 存 在 队列 或 资源 限制 ， 而 导致 单个 ldev 的 IOPS 上 
不 去 。 所 以 我 们 在 进行 存储 IO 设计 时 ， 必 须 结 合 我 们 使 用 的 存储 产品 去 了 解 这 个 存储 的 
一 些 算 法 规则 与 限制 。 

Cache 的 命中 率 取决 于 数据 的 分 布 `.Cache 的 大 小 、 数据 访问 的 规则 以 及 Cache 的 算法 。 
如 果 完 整 讨 论 下 来 ， 这 里 将 变 得 很 复兴 ， 超 出 了 本 书 的 讨论 范围 。 我 这 里 只 强调 Cache 的 
命中 率 ， 对 于 阵列 ， 读 Cache 的 命中 率 越 局 越 好 ， 这 一 般 表示 它 可 以 文 持 更 多 的 IOPS,， 为 
什么 这 么 说 昵 ? 这 就 与 我 们 下 和 面 要 讨论 的 人 硬盘 IOPS 有 关系 了 。 

便 盘 的 限制 ， 每 个 物理 人 硬盘 能 处 理 的 IOPS 是 有 限制 的 ， 比 如 : 


10UKTPm 1 3Krpm ATA 
10M/s 13M/s 8M/s 

1 UKTPm 1 Krpm ATA 
100IOPS 120TOPS a0IOPS 


同样 , 如果 一 个 阵列 有 120 块 15K rpm 的 光纤 人 硬盘, 那么 这 个 陈列 能 文 撑 的 最 大 IOPS 
为 120*150=18000， 这 是 人 刹 件 限制 的 理论 值 ， 如 末 超 过 这 个 值 ， 人 硬盘 的 啊 应 可 能 会 变 得 非 
党 缓慢 而 不 能 正常 提供 业务 。 

在 RAID 5 与 RAID 10 上 ， 读 IOPS 没有 差别 。 但 是 ， 相 同 的 业务 写 IOPS， 最 终 落 在 
磁盘 上 的 IOPS 却 是 有 差别 的 ， 而 我 们 评估 的 正 是 磁盘 的 IOPS， 如 果 达 到 了 磁盘 的 限制 ， 
性 能 肯定 是 上 不 去 了 。 

我 们 在 第 1 章 中 手机 银行 系统 的 IOPS 是 10000， 读 Cache 的 命中 率 是 30%， 读 IOPS 
为 60%, 写 IOPS 为 40%, 磁盘 个 数 为 120。 我 们 分 别 计 算 在 RAID 5 与 RAID 10 的 情况 下 ， 
每 个 磁盘 的 IOPS 为 多 少 。 


RAID 5 

单 块 盘 的 IOPS = (10000*(] - 0.3)*0.6 + 4* (10000*0.4))/120 
= (4200 + 16000)/120 
-i 
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这 里 的 10000*(1 - 0.3)*0.6 表示 是 读 的 IOPS， 比 例 是 0.6， 除 掉 Cache 命中 ， 实 际 只 
有 4200 个 IOPS。 而 4*(10000*0.4) 表示 写 的 IOPS， 因 为 每 一 个 写 ， 在 RAID 5 中 ， 实 际 
发 生 了 4 个 IO， 所 以 写 的 IOPS 为 16000 个 。 为 了 考虑 RAID 5 在 写 操作 的 时 候 ， 那 两 个 
谈 操 作 也 可 能 发 生命 中 ， 上 所 以 更 精确 的 计算 为 : 
单 块 盘 的 IOPS= (10000*(] - 0.3)*0.6 二 2* (10000*0.4)*(] - 0.3)+2* (10000*0.4))/120 
= (4200 + 5600 + 8000)/120 
= 148 
计算 出 来 单个 盘 的 IOPS 为 148 个 ， 基 本 达到 磁盘 极限 。 


RAID 10 

单 块 盘 的 IOPS = (10000*(1-0.3)*0.6 + 2* (10000*0.4))/120 
= (4200 + 8000)/120 
= 102 


可 以 看 到 ， 因 为 RAID 10 对 于 写 操作 。 只 发 生 两 次 IO， 所 以 同样 的 压力 ， 同 样 的 位 
从 ， 每 个 盘 的 IOPS 只 有 102 个 ， 还 远 远 低 于 磁盘 的 极限 IOPS。 
2.7.3 ”RAID 10 和 RAID 5 的 比较 

在 我 们 考虑 存储 IO 设计 时 ， 到 底 用 RAID 10 还 是 选择 RAID 5 呢 ? 下 面 我 们 来 做 个 
比较 。 

为 了 方便 对 比 ， 这 里 拿 同 样 多 驱动 占 的 磁盘 来 做 对 比 ，RAID 10 选择 2D+2D 的 RAID 
方案 ，RAID 5 选择 3D+1P 的 RAID 方案 ， 如 图 2-30 和 图 2-31 所 示 。 


图 2-30 RAID 10(2D+2D) 


71 


fz 


DB2 数据 库 性 能 调整 和 优化 (第 3 版 ) 


图 2-31 RAID 5(3D+1P) 


1. 安全 性 方面 的 比较 


其 实在 安全 性 方面 ， 地 庸 置疑 ， 肯 定 是 RAID 10 的 安全 性 高 于 RAID 5。 我 们 可 以 通 
过 简单 的 分 析 来 得 出 此 结论 。 当 有 磁盘 损坏 时 ， 对 于 RAID 10， 只 有 当 这 块 磁盘 对 应 的 镜 
像 盘 也 损坏 ， 才 会 导致 RAID 失效 。 但 是 对 于 RAID S， 剩 下 的 3 块 盘 中 ,任何 一 块 盘 出 现 
故障 ， 部 将 导 臻 RAID 失效 。 

在 恢复 的 时 候 ，RAID 10 恢复 的 速度 也 快 于 RAID 5。 


2. 空间 利用 率 的 比较 


RAID 10 的 利用 率 是 50%，RAID 5 的 利用 率 是 75%。 伺 盘 数 量 越 多 ，RAID 5 的 空间 
利用 率 越 高 。 


3. 读 写 性 能 方面 的 比较 
要 分 析 如 下 3 个 操作 : 连续 写 、 离 散 写 。 


提示 : 
存储 的 Cache 我 们 已 经 在 2.5.3 中 讲述 ， 因 为 这 3 个 操作 跟 Cache 有 很 大 的 关系 。 


1) 读 操 作 方 面 的 性 能 对 a 
RAID 10 可 供 读 取 有 效 数 据 的 磁盘 个 数 为 4，RAID 5 可 供 读 取 有 效 数据 的 磁盘 个 数 也 
为 4( 校 验 信息 分 布 在 所 有 的 盘 上 )， 所 以 两 者 在 谈 方 面 的 性 能 应 该 是 基本 一 致 的 。 


2) 连续 写 方面 的 性 能 差异 
在 连续 写 操作 过 程 中 , 如 果 有 写 Cache 存在 , 并 且 算 法 没有 问题 的 话 , RAID 5 比 RAID 10 
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其 全 会 更 好 一 些 , 虽然 也 许 并 没有 太 大 的 差别 (这 里 假定 存储 有 一 定 大 小 , 足够 的 写 Cache， 
而 且 计算 校 验 的 CPU 不 会 出 现 瓶 颈 )。 

因为 这 个 时 候 的 RAID 校 验 是 在 Cache 中 完成 的 , 如 4 块 熏 的 RAID $， 可 以 先 在 内 存 
中 计算 好 校 验 ， 然 后 同时 与 入 3 个 数据 +1 个 校 验 。 而 RAID 10 只 能 同时 写 入 2 个 数据 +2 
个 镜像 。 

如 图 2-32 所 示 , 4 块 盘 的 RAID5 可 以 在 同一 时 间 写 入 1、2、3 到 Cache, 并 且 在 Cache 
计算 好 校 验 之 后 ， 这 里 假定 是 6， 同 时 把 这 4 个 数据 写 到 和 磁盘。 而 4 块 盘 的 RAID 10 不 管 
Cache 是 否 存在 ， 写 的 时 候 ， 都 是 同时 与 2 个 数据 或 2 个 镜像 。 


图 2-32 ”连续 写 


根据 前 面 对 缓 存 原理 的 介绍 ， 写 Cache 是 可 以 缓存 写 操作 的 ， 等 到 缓存 写 数据 积累 到 
一 定时 期 再 写 到 磁盘 。 但 是 ， 写 到 人 厂 熏 阵列 的 过 程 是 迟早 也 要 发 生 的 ， 所 以 RAID 5 与 
RAID 10 在 连续 写 的 情况 下 ， 从 缓存 到 人 厂 盘 的 写 操作 速度 会 有 较 小 的 区 别 。 不 过 ， 如 果 不 
是 连续 性 的 强 连续 写 ， 只 要 不 达到 磁盘 的 写 极 限 ， 差 别 并 不 是 太 大 。 


3) 离散 写 方 面 的 性 能 差异 

例如 DB2 数据 库 每 次 写 一 个 数据 块 的 数据 ， 如 4KB 或 8SKB， 由 于 每 次 与 入 的 量 不 是 
很 大 ， 而 且 写 入 的 次 数 非常 频繁 ， 因 此 联机 日 志 看 起 来 会 像 是 连续 写 。 但 是 因为 不 保证 能 
够 填 满 RAID 5 的 一 个 条 带 ， 比 如 32KB( 保 证 每 张 盘 都 能 写 入 )， 所 以 很 多 时 候 更 加 偏向 于 
离散 写 入 ( 写 入 到 已 存在 数据 的 条 市 中 )。 

离散 写 的 时 候 ，RAID 5 与 RAID 10 的 工作 方式 有 什么 不 同 ? 查看 图 2-33， 假 定 要 把 
数字 2 变 成 数字 4， 那 么 对 于 RAID 5， 实 际 发 生 了 4 次 IO: 先 读 出 2 与 校 验 6， 可 能 发 生 
读 命中 ， 然 后 在 Cache 中 计算 新 的 校 验 ， 写 入 新 的 数字 4 与 新 的 校 验 8。 对 于 RAID 10， 
同样 的 操作 ， 最 终 RAID 10 只 需要 两 个 IO， 而 RAID 5 需要 4 个 IO 
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图 2-33 ”离散 写 


这 里 我 忽略 了 RAID 5 在 那 两 个 读 操 作 的 时 候 ， 可 能 会 发 生 读 命中 操作 的 情况 。 也 就 
是 说 ， 如 果 需 要 谈 取 的 数据 已 经 在 Cache 中 ， 可 能 是 不 需要 4 个 IO 的 。 这 也 证 明了 Cache 
对 RAID 5 的 重要 性 ， 不 仅仅 是 计算 校 验 需 要 ， 而 且 对 性 能 的 提升 尤为 重要 。 

当然 ， 并 不 是 说 Cache 对 RAID 10 束 不 重要 了 ， 因 为 写 缓冲 、 读 命中 等 ， 者 是 提高 速 
度 的 关键 所 在 ， 只 不 过 RAID 10 对 Cache 的 依赖 性 没有 RAID 5 那么 明显 而 已 。 


4) 磁盘 的 IOPS 对 比 

对 空间 利用 紊 要求 较 高 ， 而 对 安全 性 要 来 不 是 特别 珊 的 大 文件 存储 系统 , 采用 RAID 5 
比较 好 。 相 反 ， 安 全 性 要 求 很 局， 不 计 成 本 ， 小 数据 量 频 索 号 入 的 系统 采用 RAID 10 比 
较 好 。 

根据 我 的 经 验 与 分 析 : 小 IO 的 数据 库 类 型 操作 , 如 ERP 等 应 用 ,建议 采用 RAID 10; 
而 大 型 文件 存储 、 数 据 仓 库 ， 如 医疗 PACS 系统 、 视 频 编 辑 系统 ， 从 衬 间 利用 的 角度 ， 建 
议 采 用 RAID 5。 

在 一 个 实际 的 案例 中 ,一 个 恢复 压力 很 大 的 standby( 这 里 主要 是 写 ,而 且 是 小 IO 的 写 )， 
采用 了 RAID 5 的 方案 ， 发 现 性 能 很 产 ， 通过 分 析 ， 每 个 磁盘 的 IOPS 在 高 峰 时 期 ， 快 达到 
200 了， 导致 响应 速度 非常 慢 。 后 来 改造 成 RAID 10， 就 避免 了 这 个 性 能 问题 ， 每 个 磁盘 
IOPS 降 到 了 100 左右 。 所 以 ， 了 解 RAID 5 和 RAID 10 原理 ， 对 于 我 们 根据 应 用 系统 
的 特点 来 做 存储 IO 设计 ， 从 而 保证 性 能 非常 重要 。 


2.8” 展 好 存储 规划 的 目标 


民 好 存储 规划 的 目标 是 从 业务 服务 需求 出 发 ， 尤 其 重点 关注 事务 啊 应 时 间 和 事务 处 理 
的 持续 并 上 友 能 力 ， 存 储 系统 资源 规划 以 部 件 啊 应 能 力 为 基础 ， 降 低 存 储 系统 热点 、 容 灾 、 
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利用 率 及 维护 对 服务 能 力 的 影响 。 

1) 降低 主机 磁盘 啊 应 时 间 

重点 分 析 规 划 影 响 主 机 磁盘 啊 应 时 间 的 关键 因素 ， 包 括 数 据 的 IO 特征 、 数 据 保 护 方 
式 、 部 件 利 用 率 、 数 据 处 理 并 发 性 。 

2) 降低 资源 热点 对 性 能 的 影响 

重点 分 析 规 划 存 储 连 接 端 口 、 缓 存 、 磁 盘 、 磁 盘 控 制 卡 以 及 交换 机 端口 ， 分 析 排 查 IO 
等 待 队 列 、Pending 数据 、 命 中 率 等 数据 特点 。 

3) 降低 容 灾 保护 对 性 能 的 影响 

重点 分 析 规 划 容 灾 的 高 负载 的 数据 卷 、 容 灾 数 据 卷 的 数据 量 及 写 数 据 的 均衡 能 力 ， 以 
及 容 灾 数 据 处 理 的 链 路 响应 等 。 

4) 合理 存储 资源 利用 率 定 位 

重点 分 析 规 划 存 储 连 接 端口 、 缓 存 、 磁 盘 、 磁 盘 控 制 卡 、 容 灾 控 制 卡 以 及 交换 机 端口 ， 
分 析 部 件 利用 率 运 行 状态 ， 部 件 利用 率直 接 影 啊 数据 处 理 啊 应 时 间 。 

5) 降低 部 件 故障 对 系统 性 能 的 影响 

重点 分 析 规 划 存 储 连接 端口 、 缓 存 、 磁 盘 、 磁 盘 控制 卡 以 及 交换 机 端口 等 系统 部 署 宛 
余 性 ， 分 析 排 查 系 统 元 余部 件 的 耦合 性 。 


2.9 ” 恨 好 存储 规划 的 设计 原则 


在 进行 存储 LO 设计 时 ， 我 们 可 以 参考 以 下 设计 原则 : 

1) 确保 您 的 数据 均匀 地 分 布 在 所 有 的 物理 磁盘 中 。 如 果 您 的 数据 仅 位 于 几 个 盘 中 ， 那 
么 使 用 多 个 逻辑 单元 号 LUN) 或 物理 磁盘 又 有 什么 实际 意义 呢 ? 

2) 如 果 您 使 用 了 SAN 或 其 他 类 型 的 存储 阵列 ， 那 么 您 应 该 尝试 在 创建 阵列 时 使 它们 
具有 相同 的 大 小 和 类 型 。 您 还 应 该 在 创建 它们 时 ， 为 每 个 阵列 使 用 LUN， 然 后 将 所 有 的 多 
辑 卷 分 做 到 卷 组 中 的 所 有 物理 郑 上 。 

3) 您 还 应 该 确保 镜像 位 于 不 同 的 磁盘 和 适 配 髓 。 

4) 数据 库 索 引 表 空间 容 堪 和 数据 表 空 间 容 器 也 应 该 位 于 不 同 的 物理 磁盘 。 

5) 对 于 表 空 间 容器 和 数据 库 日 志 ， 应 该 存放 到 不 同 的 RAID GROUP 上 。 

6) 物理 设备 方 和 面 。 使 用 高 速 适 配器 连接 磁盘 驱动 器 ， 上 其 有 大 的 Cache， 这 一 点 是 非常 
重要 的 ， 但 是 您 必须 确保 总 线 本 和 映 不 会 成 为 瓶 贷 。 要 防止 这 种 情况 发 生 ， 确 保 将 适配器 分 
散 到 多 个 总 线 。 同 时 ， 不 要 将 过 多 的 物理 磁 檀 或 LUN 连接 到 任何 一 个 适配器 ， 因 为 这 样 
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做 也 会 对 性 能 产生 极 大 的 影响 。 您 配置 的 适配器 越 多 越 好 ， 特 别 是 在 大 量 磁盘 的 利用 率 都 
很 高 的 情况 下 。 

7) 您 还 应 该 确保 设备 驱动 程 订 尽 可 能 文 持 多 路 人 径 ITO(MPIO)，MPIO 文 持 VO 子 系统 
的 负载 平衡 和 流量 控制 。 

8) 监控 存储 Cache 的 命中 率 ， 确 保 Cache 的 大 小 设置 应 该 与 业务 特点 (是 OLTP 还 是 
OLAP 业务 类 型 ) 和 数据 页 (data page) 的 大 小 设置 合理 。 

9) 选择 合适 的 RAID 级 别 。 根 据 目 己 应 用 系统 的 业务 类 型 来 选择 合适 的 RAID 级 别 。 
一 般 来 说 ， 有 以 下 两 种 典型 的 业务 类 型 : 

e 70/30/50 一 一 70% 读 ，30% 写 ，Cache 命中 率 50%， 这 是 典型 的 高 并 发 OLTP 系统 。 

e 100/100 一 一 100% 读 ，100% 写 ， 这 是 典型 的 OLAP、DSS 系统 。 

对 于 小 VO 的 数据 库 类 型 操作 ， 如 ERP、 银行 账 务 系统 、 移 动 计 费 系 统 等 应 用 ， 建 议 
采用 RAID 10; 而 大 型 文件 人 存储、 数据 仓库 ， 如 报表 系统 、 数 据 集 市 系统 ， 从 空间 利用 的 
角度 ， 建 议 采 用 RAID 5。 

10) 在 存储 上 选择 合适 的 条 带 化 大 小 (stripe size), 确保 条 带 化 大 小 要 和 数据 库 的 IO 特 
点 结合 ， 因 为 对 于 OLTP 应 有 用， 数据库 IO 基本 是 随机 小 块 读 写 ， 而 对 于 OLAP 应 用 ， 数 
据 库 IO 是 连续 大 块 读 写 。 

11) 确 剑 操作 系统 层面 和 存储 层面 的 条 市 化 大 小 设置 一 致 ， 操 作 系 统 方 面 的 条 市 化 大 
小 尽量 大 些 。 


2.10 ”存储 相关 性 能 调整 案例 


下 面 我 们 举 一 个 实际 的 案例 来 说 明 在 存储 这 个 层面 的 优化 对 数据 库 性 能 提升 的 贡献 。 
客户 应 用 系统 环境 : 

e 存储 : EMC 存储 VMAX 

e 操作 系统 : IBM AIX 

e 数据库: DB2 V9.7 

e 多 路 径 通 道 软件 ， POWERPATH 

存储 性 能 规划 过 程 如 图 2-34 所 示 。 
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存储 性 能 规划 过 程 


数据 由 


| 性 能 及 配置 数据 分 解 i 
响应 时 间 OPS/KBP: I 分 析 对 比 


规划 方案 


系统 部 晋 / 修 订 


1 


图 2-34 存储 性 能 规划 过 程 


B 系统 经 历 多 次 压力 测试 ， 在 存储 调 优 之 前 ， 集 中 处 理 的 大 任务 的 执行 时 间 有 8$% 左 
右 在 数据 库 中 ， 性 能 的 瓶颈 出 现在 数据 库 层 面 。 而 且 总 的 执行 时 间 大 幅度 地 超过 了 设计 日 
标 ， 某 个 大 任务 的 执行 时 间 达 到 了 8 小 时 。 

经 过 多 方 深 入 分 析 ， 基 本 得 出 了 结论 : 数据 库 本 喘 的 优化 空间 很 小 ， 主 要 的 优化 方 问 
应 集中 在 存储 层次 。 

存储 系统 针对 每 次 测试 的 特点 ， 深 入 分 析 了 存储 系统 存在 问题 ， 有 和 针对 性 地 对 规划 进 
行 了 修订 ， 并 对 部 署 方案 进行 了 调整 ， 下 面 是 比较 重大 调整 的 效果 对 比分 析 : 

1) Host Stripe 调整 效果 分 析 

4 月 12 日 , B 系统 的 日 志 空 间 修改 为 Stripe 方式 , Stripe Size 为 64KB, 在 未 启用 SRDF 
的 情况 下 ， 主 机 使 用 LOG 空间 磁盘 的 写 啊 应 时 间 由 15ms 降低 为 0.7ms， 如 图 2-35 所 示 。 


HostStripe 调整 效果 分 析 
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图 2-35 HostStripe 调整 效 末 分 析 
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2) FA 端口 扩充 效果 分 析 

FA 端口 经 过 多 次 扩充 , 4 月 25 日 , B 系统 的 主机 系统 与 存储 系统 使 用 FA 关系 为 1:1。 
在 未 启用 SRDF 的 情况 下 ， 主 机 使 用 数据 空间 磁盘 的 写 啊 应 时 间 由 1lms 降低 为 4.5ms， 如 
图 2-36 所 示 。 


FA 宛 效 未 分 机 


4 月 12H /A\ 
\ A 


| 
训 人 的 六 1 


we] | a rl BE a 
攻关 仙山 二 


| 和 好 了 Fy 同业 有 秽 -| 


Dences WF .Sampled everage nie ine Ee 
A pA 

人 

Bl 刘 交 和 到 放 可 租 a Un 册 浊 是 局 奈 避 尊 次 刚 nt 


| 新 二 术 认 人 


MA De a Po 3 


Dons WF -pe 人 | 


图 2-36 FA 扩充 效果 分 析 
3) 容 灾 端口 扩充 效 打 分 析 
RF 端口 经 过 扩充 ，5 月 15 日 ，B 系统 的 主机 系统 与 存储 系统 使 用 的 RF 端口 数量 由 


4RF 扩充 到 8RF。 在 未 使 用 Extanded License 和 未 加 BufferCredit 的 情况 下 ， 主 机 使 用 数据 
空间 磁盘 的 写 啊 应 时 间 由 69ms 降低 为 45ms， 如 图 2-37 所 示 。 


RF 扩充 效果 分 析 
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图 2-37 RF 扩充 效果 分 析 
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4) 存储 交换 机 增加 BufferCredit 及 数据 卷 Stripe 调整 效果 分 析 

$ 月 31 日 , 存储 交换 机 使 用 Extanded License 和 增加 BufferCredit=200, 同时 在 B 系统 
主机 的 Data&Index 采用 HostStripe 为 64KB 的 情况 下 ， 主 机 使 用 数据 空间 磁盘 的 写 啊 应 时 
间 由 45ms 降低 为 16ms， 如 图 2-38 所 示 。 


Data&Index Stripe 调整 及 BufferCredit 扩充 效果 分 析 
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图 2-38 ”Data&Index Stripe 调整 及 BufferCredit 扩充 效果 分 析 


小 结 : 

从 上 述 对 比 测试 中 我 们 可 以 看 到 ， 以 上 调整 对 性 能 的 提升 有 极 大 帮助 。 随 着 存储 层次 
的 IO 时 间 大 幅度 缩小 ， 业 务 的 执行 时 间 也 有 着 非常 大 的 变化 ， 如 批 处 理 时 间 由 原来 的 8 
小 时 缩短 至 不 到 3 小 时 ， 这 对 性 能 的 指标 来 说 有 着 质 的 飞跃 。 数 据 库 部 分 占用 的 处 理 时 间 
比例 也 大 幅度 降低 ， 数 据 库 不 再 成 为 业务 性 能 的 瓶颈 。 


2.11 存储 I/O 性 能 调整 总 结 


数据 库 中 数据 的 访问 离 不 开 LO 行为, 所 以 LO 的 性 能 对 数据 库 性 能 有 看 致命 的 影 啊 ， 
因此 作为 VO 行为 的 具体 执行 者 一 一 仓储 系统 的 性 能 束 显 得 全 关 重 要 。 而 存储 系统 的 特点 
又 决定 了 事先 的 规划 远 远 重要 于 事后 的 调 优 。 

存储 是 一 门 学 问 ， 在 本 章 中 我 们 只 是 简单 地 讲解 了 存储 的 一 些 概 念 ， 以 及 存储 LO 设 
计 中 的 通用 性 能 原则 。 为 什么 要 讲解 呢 ? 这 是 因为 在 数据 库 的 性 能 调 优 中 ， 这 一 部 分 是 必 
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须 考 碟 的 ， 而 且 往 往 会 由 于 前 期 的 存储 IO 设计 不 合理 而 导致 后 期 严重 的 性 能 问题 。 关 于 
这 一 部 分 更 深 的 知识 ， 建 议 谈 者 参考 存储 方面 的 书籍 。 


2.12 ”本 章 小 结 


性 能 调 优 是 个 系统 工程 ， 目 前 的 业务 系统 者 是 一 整套 的 复杂 系统 ， 从 上 至 下 包括 以 下 
几 个 层次 : 应 用 程序 、 中 间 件 应 用 服务 船 、 数 据 库 、 主 机 系统 (操作 系统 )、 光 纤 区 换 机 和 
SAN 存储 网 络 。 在 系统 发 生性 能 问题 时 ， 性 能 问题 的 定位 和 调 优 很 复杂 。 对 于 数据 库 的 性 
能 调 优 来 讲 ，DBA 午 握 操作 系统 的 性 能 调 优 和 存储 IO 设计 方面 的 调 优 知识 ， 是 非 闸 有 必 
要 的 。 当 然 ， 操 作 系统 和 存储 的 IO 设计 本 章 具 是 涉及 了 很 小 的 一 部 分 ， 更 深入 的 知识 还 
是 需要 读者 参考 相关 的 书籍 。 


DB2 性 能 监控 


在 《循序 渐进 DB2( 第 3 版 )》 一 书 中 , 我 们 给 大 家 讲解 了 DB2 数据 库 的 主要 监控 工 
关于 这 些 工具 的 原理 机 制 读者 可 以 参考 该 书 。 本 章 我 们 主要 侧重 于 如 何 应 用 这 些 监 ee 
来 定位 津 见 的 性 能 问题 。 

本 章 主 要 讲解 如 下 内 容 : 

e 快照 监视 器 案例 

e 事件 监视 器 案例 

e 利用 表 函 数 监 控 
e 性 能 管理 视图 监控 案例 
涡 
二 


4 


db2pd 
db2mtrk 


3.1 快照 监视 器 案例 


3.1.1 监控 动态 SQL 语句 


例 3-1 中 显示 的 脚本 将 发 出 "db2 get snapshot for all on dbname>snap.out" 命 令 ， 该 命令 
包括 "db2 get snapshot for dynamic SQL on dbname "命令 的 所 有 输出 。 如 果 您 发 现 不 能 捕获 
很 多 的 SQL 语句 ， 那 么 可 以 增加 监控 的 时 间 。 一 条 语句 的 输出 的 "Dynamic SQL Snapshot 
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Result” 部 分 看 上 去 如 例 3-1 所 示 。 


提示 : 
为 了 保证 监控 尽 可 能 多 的 SQL 语句 ， 建 议 增 加 DBM 配置 参数 mon heap sz。 


例 3-1 动态 SQL 快照 。 


Dynamic SQL Snapshot Result 


Database name = SAMPLE 

Database path ~ /db2/NODE0000/SOL0O0003/ 

Number of executions = 30 

Number of compilations = 1 ---- 编 译 次 数 ， 是 个 累加 值 

Worst preparation 七 Ime (ms) = 1624 -- SOQL 语句 编译 的 最 长 时 间 

Best preparation time (ms) | 

Internal rows deleted = 0 

Internal rows linserted 二 

ROWS read = 3 

Internal rows updated = 0 

Rows written = 0 

Statement sorts = 0 

Total execution time (sec.ms) = 0.934186---SQL 语句 的 总 执行 时 间 ， 可 以 根 
据 这 个 时 间 排 序 找 出 执行 时 间 

Total User cpu time (sec.ms) = 0.000000 -= 比较 长 的 so 语句 

Total System cpu time (sec.ms) = 0.000000 

Statement text = select * from sales-—-—-—-—-——-— SOL 语句 文本 


在 输出 中 可 以 搜索 一 些 很 有 用 的 字符 串 。 

"Number of executions'" 可 以 帮助 您 找到 应 该 调 优 的 那些 重要 语句 。 它 对 十 帮助 计算 
语句 的 平均 执行 时 间 也 很 有 用 。 

对 于 执行 时 间 很 长 的 语句 ， 单 独 执 行 一 次 或 许 对 系统 要 求 不 多 ， 但 是 累加 起 来 的 结果 
就 会 大 大 降低 性 能 。 应 尽量 理解 应 用 程序 如 何 使 用 该 SQL,， 或 许 只 需要 对 应 用 程序 多 辑 稍 
微 重 新 设计 一 下 整 可 以 提 融 性 能 。 

看 看 是 否 可 以 使 用 参数 标记 (parameter marker)， 以 便 为 语句 创建 包 ， 这 一 点 也 很 管用 。 
参数 标记 可 用 作 动 态 准 备 的 语句 ( 生 成 访问 计划 时 ) 中 的 占 位 符 。 在 执行 的 时 候 ， 残 可 以 将 
值 提 供给 这 些 参数 标记 ， 从 而 使 语句 得 以 运行 。 

有 时 候 ,， 使 用 "grep" (UNIX) 和 "findstr" (Windows) 对 快照 输出 执行 初步 的 搜索 非常 方 
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便 。 如 果 发 现 了 什么 可 疑 的 内 容 ， 就 可 以 通过 打开 快照 输出 并 找到 问题 所 在 ， 以 便 作 进 一 
步调 查 。 

例如 ， 为 了 识别 是 耕 存 在 死 锁 : 

在 UNIX/Linux 下 : 


qrep —1 “Deadlocks etecktead, STapouEt | rep “| mre 
在 Windows 下 : 


findstr /C:"Deadlocks detected™ snap.out | findstr /V /CcC:"= 0" 


再 如 ， 要 搜索 执行 的 最 频繁 的 语句 : 
在 UNIXW/Linux 下 : 


grep —-n"Number of executions™" snap.out | grep -Vv "= 0" | sort -K 6rn | more 
在 Windows 下 : 
Findstr YC VNaomber Of executions® Snap,out | findstr /WV yyEC*"— 0" 


注意 : 
在 Windows 下 执行 的 时 候 ， 注 意 中 英 文 转换 ， 例 如 “Number of executions” 在 中 文 环 
境 中 应 该 用 “执行 次 数 ” 代 替 。 这 里 主要 讲 思 路 ， 


"Rows read'" 可 帮助 识别 谈 取 行 数 最 多 的 动态 SQL 语句 。 如 果 谍 取 的 行 数 很 多 ， 通 
常 意 味 着 要 进行 表 扫 描 。 如 果 这 个 值 很 高 ， 也 可 能 表明 要 进行 索引 扫描 ， 扫 描 时 选择 性 很 
小 ， 或 者 没有 选择 性 ， 这 跟 表 扫描 一 样 糟糕 。 

您 可 以 使 用 Explain 工具 来 查看 是 耕 真 的 如 此 。 如 果 有 表 扫 描 发 生 ， 那 么 可 以 对 表 执 
行 一 次 RUNSTATS， 或 者 将 SQL 语句 提供 给 DB2 Design Advisor(db2advis)， 以 便 令 其 推 
荐 一 个 更 好 的 索引 ， 以 此 来 进行 弥补 。 如 果 是 选择 性 很 差 的 索引 扫描 ， 或 许 需要 一 个 更 好 
的 索引 。 可 以 试 试 Design Advisor。 


Grep -mn RowS read” snap.out | grep -YY "=0" | sort ~—k ornlmore UNIEX/DLINUX 
Findstr 1C:™ Rows read”™ snap-out | findstr /VYV /CC:"— 0" —— 一 Windows 


"Total execution time" 是 将 语句 每 次 执行 时 间 加 起 来 得 到 的 总 执行 时 间 。 我 们 可 以 很 
方便 地 将 这 个 数字 除 以 执行 的 次 数 来 得 到 平均 执行 时 间 。 如 果 发 现 语句 的 平均 执行 时 间 很 
长 ， 那 么 可 能 是 因为 表 扫 描 和 /或 出 现 锁 等 竺 lock-waibD。 有 索引 扫描 和 页 面 获 取 导 致 的 大 量 
IO 活动 也 是 原因 之 一 。 通 过 使 用 索引 ， 通 常 可 以 避免 表 扫 接 和 锁 等 每。 锁 会 在 提 区 的 时 
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候 释 放 ， 因 此 如 果 提 区 得 更 频繁 一 些 ， 或 许可 以 弥补 锁 等 每 的 问题 。 

在 UNIX/Linux 下 : 

grep -nm "Total execution time™ snap-.out | grep ~v "= 0.0"|sort 一 K érn| more 

在 Windows 下 : 

Findstr 人 > "TOLAaAL exeention Lime” snap2oul | fndstr yY /CC:"= 0.0" |367E /RR 

"Statement text" 显示 语句 文本 。 如 条 注意 到 了 重复 的 语句， 这 些 语句 除了 WHERE 子 
句 中 谓词 的 值 有 所 不 同 以 外 ， 其 他 地 方 都 是 一 致 的 ， 那 么 就 可 以 使 用 参数 标记 ， 从 而 避免 
每 次 执行 时 重新 编译 语 铅 。 这 样 可 以 使 用 相同 的 包 ， 从 而 帮助 避免 重复 的 语句 准备 ， 而 这 
种 准备 的 消耗 是 比较 大 的 。 还 可 以 将 语句 文本 输入 到 Design Advisor (db2advis) 中 ， 以 便 
生成 最 优 的 索引 。 

在 UNIXW/Linux 下 : 

drep -EE ~” Statement text® ‘sSNAap-:oUut | 型 所 卫生 

在 Windows 下 : 

findstr /C: "Statement text™ snap.out 
3.1.2 ”监控 临时 表 空 间 使 用 

在 实际 的 OLAP 生产 环境 中 ， 我 们 看 到 数据 库 的 系统 临时 表 空 间 使 用 非常 频 葵 ,和 而且 
此 时 数据 库 性 能 不 佳 , 那么 我 们 如 何 合 看 各 个 应 用 对 DB2 临时 表 衬 间 的 使 用 情况 呢 ? 我 们 
都 知道 应 用 程序 在 DB2 上 运行 的 时 候 ， 会 产生 临时 表 。 这 些 操 作 包 括 : sort、group、build 
index 和 reorg 等 。 如 果 想 要 监视 各 个 应 用 程序 对 临时 表 衬 间 的 使 用 情况 ， 可 以 使 用 下 面 的 
步 又 : 

(1) 打开 monitor switches 中 的 table 监视 堪 : 

db2 update monitor switches using table on 
(2) 对 数据 库 抓 取 table 快照 : 
db2 get snapshot for tables on <db name> 
(3) 在 快照 的 输出 中 定位 到 系统 临时 表 的 信息 : 
Table Name = TEMP (00013,00002) 


这 样 的 信息 表示 这 个 表 是 系统 临时 表 ， 括 号 中 的 第 一 个 数值 是 临时 表 空 间 DD, 第 二 个 
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数值 是 DB2 分 配给 这 个 临时 表 的 临时 ID。 
(4) 在 系统 临时 表 中 定位 对 应 的 agent ID: 
Table Schema = <984><BR1I2ADM > 三 二 一 二 使 用 临时 表 空 间 的 agent ID 
Table Name = TEMP (00013,00002) 
Table Type = Temporary 
Data Object Pages = 104 
ROwS Read = 420 
Rows Written = 827 
Tverelows — 9 
Page Reorgs = 0 


其 中 ，Table Schema 后 面 的 第 1 个 数字 就 是 这 个 临时 表 归 属 的 agent ID. 


(5) 通过 这 个 agent ID， 我 们 就 可 以 使 用 应 用 程序 快照 或 db2pd 等 工具 找到 对 应 的 
应 用 : 


db2 get snapshot for application agentid 984 


分 块 游标 = NO 

动态 SQL 语句 文本 : 

select Job,sex,workdept,count(*) from employee 
group by cube(Job,sex,workdept) 


通过 这 种 方式 ， 我 们 可 以 定位 哪 条 SQL 语句 使 用 临时 表 空 间 最 多 ， 然 后 党 试 对 这 条 
SQL 语句 进行 调整 。 具 体 调 整 的 方法 可 以 参见 “第 9 章 :; SQL 语句 调 优 ”。 

在 实际 的 环境 中 ， 人 往往 通过 手动 抓 取 很 难 抓 取 到 具体 的 语句 ， 我 们 可 以 尝试 看 在 监控 
系统 中 调用 一 些 我 们 预先 写 好 的 脚本 去 抓 取 ， 这 样 在 过 到 问题 进行 查看 时 就 很 方便 了 。 

如 下 是 抓 取 临 时 表 空 间 使 用 的 范例 脚本 ， 请 大 家 参考 ; 


sh gettmpsql.sh dbname 


功能 : 找到 数据 库 中 占用 临时 表 空 间 最 大 的 10 条 SQL 语句 。 


#/bin/ksh! 

# 

db=$1 

# 

db2 connect to $db 

# 

db2 get snapshot for tables on sdb > $db.snap 
# 


cat sdb.snap |grep -1 -p "Table Name = TEMP"> 1.db2 
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cat 1.db2 |grep -1 "Data Object Pages"|sort -K 5rnlawk {print $5}"|head 
= % tab.115t 
= 
today="'date +$%Y%m$d$%HS$SM' 
echo "Begin checking" > $db $today.1log 
= 
cat tab.list|lwhile read line 
do 
agent="'cat 1.db2 |grep -p $line |grep -1 "Table Schema" |awk "{print 
SA |sed SG lsed vsy>y yg avk (print $1}”" 


echo 
W be .et .ee .s,s. i i i i. i i ,,, i i ,i, i. e , i i i, i i i i i 


均 南 坎 喜 均 翰 支 翰 坎 支 翰 支 页 坎 吉 页 坎 友 吉 去 支 去 支 支 用 >y>Ssdb stoday.1og 
cat l.db2 |grep -p $agent >> sdb $today.1og 
的 人 
echo "Agent $agent INFO:™ >>$db s$today.1og 
db2pd -Q $db ~apinfo $agent |grep -1 -p "Statement :™ >>$db S$today.1log 


echo 
LL ee i be ,ee ,ee .ee i i. .ie .ee ,ee .ee -ee .| 


>>5db S$today.1log 
done 
rm | -db tab list 
more $db stoday.1og 


输出 信息 类 似 如 下 所 未 : 


喜 翰 嘉吉 吉 圳 页 坎 坎 喜 吉 页 坎 克 吉 翰 翰 坎 克 南下 吉 去 翰 碍 页 喜 克 喜 喜 去 识 识 吉 页 坎 坎 页 支 坎 鞭 吉 黄 次 页 喜 克 南 真 翰 翰 吉 喜 识 革 吉 页 吉 页 识 吉 克 砍 坎 翰 寺 吉 砍 克 圳 破 


Table Schema A2021><UPERTAY > 
Table Name = TEMP (00004,00004) 
Table Type = Temporary 

Data Object Pages = 6580 

ROWwS Read 二 

Rows Written = | 3159 

Overflows = 

Page Reorgs 三 

Table Schema = <42021><UPERTAY > 
Table Name = TEMP (00004 .00005 ) 
Pam en Tyre = Temporary 

Data Object Pages = 6587 

RowS Read = 

RowS Written =- 13173 

Overflows = 

Page Reorgs 三 
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Agent 42021 INFO: 

List of active statements : 
UOW—1D : 有 
Activity ID : 1 
Package Schema : NULLID 
Package Name : STSSH200 
Package Version : 

Section Number : 1 


SQL Type : Dynamic 

Isolation : CS 

Statement Type : DMUL, Select (blockable) 
Statement : select 


a-ZHDM a-KHDM b.BRLHZ b-BYLHZ b.BJILHZ b.BNLHZ from 
upeotayv SE YH wTIXX DS anner Join leseTece FORCE SL Sd PTCPLAZ 
BBDS TEMP where SJRO=:L0 ) b on b .2TDM=a .HDM where a.SL CPDM=:L]1 and a.KHRO<=: LDL2 


喜 翰 去 砍 坎 克 吉 坎 砍 鞭 克 克 砍 克 间 坎 鞭 次 克 砍 吉 喜 寺 吉 砍 坎 吉 友 真 支 喜 翰 丰 克 翰 克 砍 鞭 坎 砍 克 克 翰 吉 丙 坎 支 砍 吉 翰 翰 克 砍 翰 克 克 砍 支 二 砍 克 吉 圳 次 坎 支 砍 砍 支 友 让 


3.2 事件 监视 器 及 监控 案例 


快照 监视 器 监控 的 是 数据 库 的 实时 数据 , Event Monitor( 事 件 监 视 絮 ) 记 录 某 事件 (event) 
或 转变 (transition) 出 现时 某 段 时 间 内 数据 库 的 活动 情况 。 事件 监视 器 收集 监视 器 数据 ,例如 
特定 事件 或 事务 发 生 。 因 此 ， 事 件 监视 堪 提 供 了 当 事 件 或 活动 发 生 的 时 候 ， 不 能 使 用 快照 
监视 需 监 视 的 收集 数据 库 系统 监视 需 数 据 的 方法 。 

例如 ， 假 设 您 想 要 捕获 每 当 死 锁 周 期 发 生 时 的 监视 需 数 据 。 如 果 对 死 锁 的 概念 比较 熟 
悉 有 的 话 ， 您 就 应 该 知道 数据 库 有 被 称 为 死 锁 检测 器 的 特殊 线程 (db2dlock), 该 线程 在 后 台 安 
静 地 运行 ， 并 且 在 预定 的 间隔 时 间 (dlchktiime) 内 会 “ 允 醒 ”， 扫 摘 当 前 正在 锁定 的 系统 。 如 
条 在 死 锁 周期 内 发 现 死 锁 ， 死 锁 检 测 塔 将 会 随机 选择 、 回 浚 并 且 终 止 涉及 在 此 次 周期 中 的 
任意 事务 。 被 选择 出 来 的 那个 事务 将 会 接收 到 SQL 针 误 代码 (-911)， 并 且 所 有 实际 上 已 经 
狐 得 的 锁 被 释放 ， 以 便 其 他 的 事务 能 够 继续 执行 。 

像 这 样 一 系列 的 事件 信息 不 能 被 快照 监视 占 捕 获 ， 当 死 锁 出 现时 ，DB2 将 通过 对 多 个 
事务 中 的 荣 个 事务 上 友 出 ROLLBACK( 回 退 ) 操 作 去 解决 死 锁 问 题 。 有 关 死 锁 操 作 的 信息 不 
容易 用 Snapshot Monitor 捕获 到 ， 因 为 在 能 够 担 得 快照 之 前 ， 死 锁 可 能 已 经 被 解 决 了 了 。 然 
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而 ， 事 件 监视 器 却 可 以 捕获 该 事件 的 重要 信息 ， 因 为 它 可 以 在 死 锁 周期 被 检测 到 的 瞬间 被 
激活 。 

这 两 种 监视 器 的 另外 一 个 显著 的 不 同 是 : 快照 监视 器 以 后 台 进程 的 方式 驻 留 ， 从 数据 
库 连接 建立 就 开始 捕获 监视 器 数据 ， 相反， 事件 监视 器 必须 在 它们 使 用 之 前 专门 去 建立 和 
激活 。 几 个 不 同 的 事件 监视 器 可 以 共存 ， 并 且 每 个 事件 监视 器 只 有 在 特定 类 型 的 事件 或 事 


Event Monitor 类 似 其 他 的 数据 库 对 象 , 因为 它们 是 使 用 SQL DDL( 数 据 定 义 语 言 ) 创 建 
的 ， 主 要 的 差别 是 Event Monitor 可 以 像 Snapshot Monitor 的 开关 那样 被 打开 或 关闭 。 

当 创 建 Event Monitor 时 ， 必 须 声 明 要 被 监视 事件 的 类 型 。 当 以 下 事件 发 生 时 ， 相 应 事 
件 记 录 便 被 记录 下 来 : 

DATABASF 一 一 当 最 后 一 个 应 用 程序 与 数据 库 断 开 时 ， 记 录 事 件 记 录 。 

TABLES 一 一 当 最 后 一 个 应 用 程序 与 数据 库 断 开 时 ， 记 录 每 个 活动 表 的 事件 记录 。 

DEADLOCKS 一 一 对 于 每 个 死 锁 ， 记 录 事 件 记 录 。 

TABLESPACES 一 一 当 最 后 一 个 应 用 程序 与 数据 库 断 开 时 , 对 每 个 活动 表 空 间 记 录 事 件 。 

CONNECTIONS 一 一 当 应 用 程序 与 数据 库 断 开 时 ， 对 每 个 数据 库 连 接 事件 记 录 事 件 。 

STATEMENTS 一 一 对 于 由 应 用 程序 发 出 的 每 条 SQL 语句 (动态 或 静态 )， 记 录 事 件 。 

TRANSACTIONS 一 一 当 事 务 (COMMIT 或 ROLLBACK) 完 成 时 ,为 该 事务 记录 事件 。 

Event Monitor 的 输出 存放 在 目录 或 命名 管道 中 (也 可 以 存放 在 表 中 , 这些 事件 监控 的 表 
可 以 上 自动 生 本 三 Event Monitor 被 激活 时 ， 将 生成 管道 和 文件 。 如 果 Event Monitor 的 日 
标 位 置 是 命名 管道 ,那么 可 以 通过 应 用 程序 从 管道 谈 出 数据 。 如 果 Event Monitor 的 目标 位 
置 是 目录 ， 数据 流 将 被 所 入 一 系列 文件 中 。 这 些 文件 顺序 编号 并 且 都 有 文件 附加 名 evt( 例 
如 00000000.evt、00000001.evt 等 )。 当 定义 事件 监视 需 时 ， 规 定 Event Monitor 事件 文件 的 
大 小 与 数目 。 

事件 监视 器 的 创建 方法 和 步骤 如 下 : 

(1) 创建 SQL Event Monitor， 写 入 文件 : 


db2 "create event monitor <evmname> for <evntype> write to file 'directory'™" 
例如 : 

db2 "create event monitor SQLCOST for deadlocks write to file '/tmp/event'™" 
(2) 激活 事件 监视 需 ( 确 保有 克 足 的 可 用 磁盘 空间 ): 

db2 ™set event monitor SOLCOST state = 1™ 


(3) 让 应 用 程序 运行 
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(4) 取消 油 活 事件 监视 硕 : 
db2 “set event monitor SOLCOST state = 0 


(5) 使 用 DB2 提供 的 db2evmon 工具 来 格式 化 SQL Event Monitor 原始 数据 (根据 SQL 
花 需 要 数 白 兆 字 节 的 可 用 磁盘 空间 ): 


db2evmon -ab DBNAME -evm SQLCOST > sqltrace.txt 


(6) 浏览 整个 已 格式 化 的 文件 ， 寻 找 显著 大 的 成 本 数 ( 是 个 耗 时 的 过 程 ): 


more sqltrace.txt 


其 实在 实际 的 性 能 调 优 中 , 事件 监视 融 并 没有 被 广泛 运 用 ,因为 DB2 的 事件 监视 融 在 
监控 期 间 会 产生 非常 大 的 数据 。 一 般 在 频 秦 上 发生 相 关 问 题 的 时 候 才 打开 抓 取 一 段 时 间 欠 的 
事件 。 


事件 监控 器 案例 

下 面 我 们 举 一 个 事件 监视 器 存放 在 表 中 的 例子 : 对 于 数据 库 管 理 员 ， 调 优 数据 库 常 稍 
尽 一 项 挑战 。 调 优 应 用 程序 是 一 种 方法 ， 但 在 大 多 数 生 产 系 统 中 DBA 很 少 甚 全 不 能 更 改 
源 代 人 码 ， 因 此 限制 了 他 们 调 优 应 用 程序 的 能 力 。 这 在 DBA 使 用 第 三 方 工具 时 尤为 如 此 。 
所 以 ， 通 种 最 有 效 的 调 优 方法 是 解决 问题 的 根源 ， 即 从 SQL 语句 本 上身 入 手 。 通 钊 通过 和 奉 
找 哪些 SQL 语句 消耗 的 资源 最 多 来 获得 最 佳 性 能 ， 然 后 决定 采取 一 定 的 措施 来 减少 资源 
消耗 。 

通 疝 ， 在 第 一 次 安 妆 数据 库 时 ， 会 将 其 性 能 调 全 最 优 ， 但 随 看 时 间 的 流逝 ， 一 些 利 
的 东西 开始 变 得 越 来 越 慢 。 这 在 拥有 大 量 数据 的 系统 (例如 决 宋 文 持 系 统 ) 中 尤为 明显 。 用 
性 开始 看 到 如 锁 升级 、 全 表 扫 摘 以 及 排序 这 样 的 因素 造成 性 能 下 降 ， 这 些 操作 往往 会 迫使 
系统 访问 磁盘 而 不 是 访问 内 存 。 当 出 现 这 种 情况 时 ， 最 好 检查 一 下 SQL， 看 看 可 以 做 哪些 

我 们 举 这 个 事件 监控 堪 案 例 ， 旨 在 解决 的 问题 是 : 针对 通常 的 活动 ， 调 优 应 该 用 于 最 
频 泰 访问 数据 库 的 SQL 以 及 了 最 消耗 资源 的 SQL。 为 了 简化 如 何 监控 应 用 程序 中 SQL 语句 
的 问题 ， 我 们 通过 DB2 的 事件 监视 硕 ， 确 定 哪些 SQL 语句 消耗 的 资源 最 多 。 

1) 利用 表 的 方式 

首先 ， 必 须 创 建 事件 监视 器 ， 运 行 监视 亏 来 收集 将 要 分 析 的 数据 。 

(1) 创建 事件 监视 器 。 打 开 新 的 DB2 命令 行 处 理 磊 会 话 , 然后 执行 以 下 DB2 UDB 命令 : 

db2 update monitor switches using statement on 

dha "creoate evenk moniltor sqlirace tor statoments write to Lable” 


89 


90 


DB2 数据 库 性 能 调整 和 优化 (第 3 版 ) 


创建 完 之 后 ， 我 们 可 以 看 到 ，DB2 自动 生成 了 下 面 这 张 表 : 


db2 11st tables for alllgrep -1 stmt 
SMT SOQOE TRACE DB2INST1 T2012 -1093— 11.18.44.630980 
db2%sot cvont monitor sol tirace ls tate 1 


(2) 使 该 会 话 一 下 处 于 打开 状态 , 直到 这 些 数据 库 活动 完成 ,确保 STMT SQL TRACE 
所 在 的 表 空 间 有 足够 的 存储 空间 ， 在 此 时 间 有 可 能 会 产生 非常 大 量 的 数据 。 表 空间 的 大 小 
取决 于 用 户 想 要 捕获 的 SQL 语句 的 数目 和 事务 量 。 

(3) 执行 正常 的 数据 库 活 动 ， 直 到 您 想 要 监控 的 时 段 结 束 。 这 一 监控 阶段 可 以 是 问题 
产生 时 期 ， 也 可 以 是 通 凋 的 数据 库 高 峰 期 间 。 

(4) 回 到 在 步骤 (人 1) 中 打开 的 会 话 ， 然 后 发 出 以 下 命令 : 


db2 set event monitor sgl trace state=0 
db2 terminate 


2) 分 析 输 出 
由 于 已 经 在 数据 库 表 STMT SQL TRACE 中 存储 了 所 需要 的 信息 , 因此 可 以 查询 该 表 
以 确定 “讨厌 ” 且 耗 时 的 SQL 语句 。 
需要 确定 4 类 SQL 语句 ,在 执行 以 下 查询 以 确定 这 些 语句 之 前 ,在 数据 库 配 置 参 数 中 ， 
至 少 要 为 应 用 程序 堆 大 小 (applheapsz) 分 配 256 个 页 面 。 
e 按照 执行 时 间 降 序 排列 执行 耗 时 最 长 的 SQL 语句 。 为 了 确定 这 些 语句 ， 使 用 下 面 
的 SQL SELECT 语句 : 


select stmt text, (stop 七 Ime-sStart 七 Ime) as ExecutionTime from 
stmt sql trace where stmt operation not in (7,8,9,19) order by decimal 
(ExecutionTime) desc fetch first 10 rows only 


e 按照 频率 降序 排列 执行 次 数 最 多 的 SQL 语句 。 可 以 用 下 面 这 条 答 询 来 确定 这 些 
语句 : 
select distinct varcharl(stmt text,2000} as stmt text count (*) Count from 
stmt sql trace where stmt operation not in (7,8,9,19) group by 
varchar(stmt text, 2000) erder by Count dese tebeh Tarst ronus only 
e 按照 CPU 时 间 降 序 排列 最 耗 CPU 时 间 的 SQL 语句 。 可 以 用 下 面 这 条 查询 来 确定 
这 些 语句 : 


select stmt text ,user cpu 七 Ime as UserCPU from stmt sgl trace Where 
stmt operation not nn (7.8,9719) order by userecpu dese feteh first 10 rows only 
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e 按照 总 排序 时 间 降 序 排列 排序 时 间 最 长 的 SQL 语句 。 可 以 用 下 面 这 条 和 和合 询 找到 


这 些 语句 : 


select stmt text ,total sort 七 Ime as TotalSortTime from stmt sql trace 


where stmt operation not in (7,8,9,19 ) order by decimal (total sort time) desc 


fetch first 10 rows only 


站 


’ 


捕获 每 一 类 中 的 SQL 语句 ， 并 将 它们 放 在 tune.sql 文件 中 。 将 下 面 这 行 插 入 到 该 文件 
这 样 可 以 更 改 工 作 负 载 中 每 条 语句 的 执行 频率 : 


SET EREQUENCY 区 二 


这 里 的 <x> 表 示 随 后 要 执行 SQL 语句 的 次 数 。 您 的 tune.sq] 文件 类 似 于 下 面 这 样 : 
—-#SET FREQUENCY 100 

SELECT COUNT (*) FROM EMPLOYEE; 

SELECT * FROM EMPLOYEE WHERE LASTNAME='HAAS'; 

—-#SET FREQUENCY 1 

SELECT AVG (BONUS), AVG (SALARY) FROM EMPLOYEE 

GROUP BY WORKDEPT ORDER BY WORKDEPT; 

将 这 些 SQL 语句 复制 到 tune.sql 之 后 , 检 醋 任何 SQL 语句 的 WHERE 子 句 中 是 合共 有 


参数 标记 和 从 (?)。 将 参数 标记 和 从 改 为 适当 的 数据 类 型 值 ， 以 便 在 没有 任何 错误 的 情形 下 执行 
SQL 语句 。 


为 了 确定 哪些 私 引 可 能 提 融 性 能 ， 授 如 下 所 示 执 行 双 引 顾 问 程序 : 
db2adyis =d sample <1 tune.sgql 二 七 0 ~o tuneidx.sql 


所 有 推荐 的 索引 将 放置 在 文件 tuneidx.sql 中 。 编 辑 该 文件 ， 在 文件 开始 处 添加 一 条 连 


接 语句 : 


connect to <sample> user <userid> using <password>; 
在 该 文件 未 尾 添 加 下 面 这 行 : 

terminate; 

现在 可 以 运行 该 文件 以 创建 推荐 的 索引 : 

db2 tvf tunedx.s9l -~z tuneLdx.16g 


提示 : 
其 中 ，tuneidx.log 捕获 tuneidx.sql 的 所 有 输出 。 
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另外 ， 对 于 运行 性 能 较 差 的 SQL 语句 ， 我 们 还 可 以 使 用 如 下 shell 脚本 来 分 析 DB2 中 
的 执行 时 间 和 返回 的 条 数 ， 从 这 些 信 息 使 我 们 可 以 找到 当前 数据 库 中 性 能 较 差 的 语句 : 


监控 菜 段 时 间 内 数据 库 执行 语句 的 性 能 

使 用 : sh getlongsgl.sh <dbname> <interval (S)> 
#!/usr/bin/ksh 

#shell script name 1s getlongsqgl.sh 

If [ $# -eq 0 ] ; then 

echo "Usage:getlongsqgql.sh <databasel> <interval>" 
exlt 

上 E 

DB=$1 

INTERVAL=$2 

FILENAME=Sql1 .txt 

connectdb() 


{ 
db2 GET CONNECTION STATE|grep ‘Connected'>/dev/null 


Tes2= 全 2 
If [[ $res2 -eq 0 ]] 
then 


echo "The DB $DB has been connected!™" 
二 二 
db2 connect to $DB 
res=$?2 
1=0 
wntie 1 Sy Tt .321 
do 
I= Xr SL 1 
if [[ $res -eq 0 ]] 
then 
echo "The DB $DB has been connected!" 
break 
else 
sleep 3 
db2 conneckt to $DB 
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res=s?2 
f1 
done 
EL 
} 
openEventMonitor () 
{ 


db2 “ drop table STMT SQLMON ， 

db2 “drop table CONTROL SQLMON"; 

db- "drop table CONNHEADER SQLMON"; 

db2 "drop event monitor SQLMON"™; 

db2 "create event monitor SOLMON for statements write to table™; 
db2 "set event monitor SOLMON state 1" 

sleep $INTERVAL 

db2 "set event monitor SQLMON state 0"™ 


dh2 "select START TIME, STOP TIME, {STOP TIME START TIME)}) as 
dur, ROWS READ,FETCH COUNT, substr(stmt text,l1,400) as stmt from STMT SQLMON 
order by dur desc™ > S$FILENAME 


more S$FILENAME 
} 
connectdb 


openEventMonitor 


3.3 利用 表 函 数 监 挥 


DB2 数据 库 提供 了 很 多 表 函 数 ， 通过 这 些 表 函数 可 以 获得 很 多 与 数据 库 性 能 有 关 的 信 
县 ， 所 以 也 可 以 通过 使 用 这 些 表 图 数 代 登 GET SNAPSHOT 命令 来 收集 这 些 监控 数据 。 

快照 表 函 数 能 够 捕获 的 许多 监视 需 元 素 部 受 控 于 监视 需 开 天。 如 宁 快 照 表 函数 中 的 共 
些 函 数 搞 述 中 提 到 特定 监视 毁 开 关 ， 束 表明 受 探 于 该 开关 。 

我 们 可 以 通过 引用 20 多 个 可 用 的 快照 监视 占 表 函数 中 的 一 个 来 构造 SQL 会 询 以 收集 
快照 数据 。 表 3-1 列 出 了 这 些 表 函数 并 指明 它们 所 能 获取 的 具体 快照 信息 。 
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表 3-1 部 分 表 国 效 列 表 


快照 表 函 数 返回 的 信息 
MON GET INSTANCE 数据 库 管 理 器 信息 
MON GET AGENT 返回 代理 程序 信息 
MON GET CONTAINER 返回 表 空间 容器 信息 
MON GET TABLESPACE 返回 表 空间 的 信息 


数据 库 信息 。 只 有 当 人 至 少 有 一 个 应 用 程 

序 连 接 至 数据 库 时 ， 才 会 返回 信息 

连接 至 分 区 上 数据 库 的 应 用 程序 上 的 有 

关 锁 等 待 的 应 用 程序 信息 。 这 包括 累积 

计数 器 、 状 态 信 息 和 最 近 执 行 的 SQL 语 

句 (假定 设置 了 语句 监视 器 开关 ) 

每 个 连接 至 分 区 上 数据 库 的 应 用 程序 的 

常规 应 用 程序 标识 信息 

有 关 锁 等 待 连接 至 分 区 上 数据 库 的 应 用 

程序 的 应 用 程序 信息 

有 关连 接 至 分 区 上 数据 库 的 应 用 程序 

的 语句 的 应 用 程序 信息 ， 这 包括 最 近 执 

行 的 SQL 语句 (假定 议 鞋 了 语句 星 视 名 

开关 ) 

连接 至 数据 库 的 应 用 程序 所 访问 的 每 个 

表 的 表 活 动 信息 。 需 要 表 监 视 器 开关 

数据 库 级 别 上 的 锁 信 息 ， 以 及 每 个 连接 
MON GET LOCKS 至 数据 库 的 应 用 程序 在 应 用 程序 级 别 上 

的 锁 信 息 。 需 要 锁 监 视 器 开关 

指定 数据 库 的 缓冲 池 活 动 计 数 器 。 需 要 

缓冲 池 监 视 器 开关 

来 白 用 于 数据 库 的 SQL 语句 高 速 缓存 的 

某 个 时 间 点 语句 信息 


MON GEI DATABASE 


MON GET CONNECTION 


MON GET UNIT OF WORK 


MON GET APPL LOCKWAIT 


MON GE ACIIVILTY 


MON GET TABLE 


MON _ GEL BUFFERPOOL 


MON GET PKG CACHE STMT 


我 们 可 以 通过 下 面 的 SQL 语句 返回 所 有 的 表 函 数 : 


db2 "select distinct funcname from syscat.functions where funcname like 


‘MON GET$"" 


FUNCNAME, 
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Ab [|| tem 
月 FE 二 


MON 


GET 


MCTIEVTITY 


MON GET ACTIVITY DETAILLS 


MON 
MON 
MON 
MON 
MON 
MON 
MON 
MON 
MON 
MON 
MON 
MON 
MON 
MON 
MON 
MON 
MON 
MON 
MON 
MON 
MON 


GET 
GET 
GET 
GET 
GET 
GET 
GETE 
GET 
GET 
GET 
GET 
GET 
GET 
GET 
GET 
GET 
GET 
GET 
GET 
GET 
GET 


AGENT 

APPLICATION HANDLE 
APPLICATION ID 

APPL LOCKWAIT 

AUTIO MAINT QUEUE 
AUTIO RUNSTATS QUEUE 
BUEFFERPOOL 

CR 

CE CMD 

CE WAIT TIME, 
CONNECTION 
CONNECTION DETAITLLS 
CONTAITNER 

DATABASE 

DATABASE DETALTLS 
EATENDED LATCH WAIT 
EATENT MOVEMENT STATUS 
FCM 

PLM CONNECTION LIST 
GROUP BUFEFERPOOL 
HADR 

TNDEAX 

TINDEX USAGE, LIST 


~_ TINSTANCE 


LATCH 

LOCKS 

MEMORY POOL 
MEMORY SET 

PAGE ACCESS LNEO 
PRG CACHE STIMT 
PRG CACHE STMT DETALLDLS 
QUEUE STATS 
REBALANCE STATUS 
ROUTINE 

ROUTINE DETAILS 
ROUTINE EXEC LIST 


_RTS RQST 
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MON GET SECTION 

MON GET SECTION OBJECT 

MON GET SECTION ROUTINE 

MON GET SERVERLIST 

MON GET SERVICE SUBCLASS 

MON GET SERVICE SUBCLASS DETAITILS 
MON GET SERVICE SUBCLASS STATS 
MON GET SERVICE SUPERCLASS STATS 
MON GET TABLE 

MON GET TABLESPACE 

MON GET TABLESPACE QUIESCER 
MON GET TABLESPACE RANGE 

MON GET TABLE USAGE LIST 

MON GET TRANSACTION LOG 

MON GET UNIT OF WORK 

MON GET UNIT OF WORK DETAILLS 
MON GET USAGE LIST STATUS 

MON GET UTILITY 

MON GET WORKLOAD 

MON GET WORKLOAD DETAITLS 

MON GET WORKLOAD STATS 

MON GET WORK ACTION SET STATS 


6l1] record(s) selected. 


快照 监视 器 数据 组 织 
所 有 的 快照 表 函 数 部 返回 一 张 监视 占 数 据 表 ， 其 中 的 每 一 行 代 表 一 个 正 被 监控 的 数据 
库 对 象 实例 , 而 每 一 列 代表 一 个 监视 器 元 素 。 监视 上 融 元素 代表 数据 库 系 统 状态 的 特定 属性 。 


捕获 监视 器 数据 快照 

要 使 用 快照 表 函 数 捕获 直接 访问 的 快照 ， 请 完成 以 下 步骤 

(1) 连接 至 数据 库 。 可 以 是 您 需要 监控 的 实例 中 的 任何 数据 库 。 要 能 够 使 用 快照 表 函 
数 发 出 SQL 查询 ， 您 必须 连接 至 数据 库 。 

例如 : 

db2 connect to sample 

C) 确定 您 需要 捕获 的 快照 类 型 ， 以 及 您 需要 监控 的 数据 库 和 分 区 。 除 了 收集 这 个 信 
县 之 外 ， 请 打开 任何 可 应 用 的 监视 画 开 关 ( 通 过 检查 表 3-1 中 的 快照 表 函 数 括 述 可 以 确定 这 


= 
局 )。 


例如 ， 如 果 您 想 要 捕获 表 活 动 数 据 的 快照 (使 用 表 函 数 SNAPSHOT TABLE)， 那 么 将 
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需要 激活 TABLE 监视 器 开关 : 
db2 update dbm cfg using DFT MON TABLE on 


(3) 使 用 期 望 的 快照 表 函 数 发 出 查询 。 
例如 ， 以 下 会 询 捕 获 有 关 当 前 已 连接 分 区 的 SAMPLE 数据 库 的 表 活 动 信息 的 快照 ， 


db2 "Select * from TABLEIMON GET TABLE( yy "rr 2)}) as 


表 子 数 有 二 个 输入 参数 : 

e。 VARCHAR(128)， 用 于 SCHEMA 名 称 。 如 果 输 入 NULL， 就 返回 所 有 SCHEMA 
对 应 的 表 信 息 。 

e VARCHAR(128)， 用 于 表 名 称 。 如 果 输 入 NULL， 就 返回 所 有 表 信 息 。 

e SMALLINT， 用 于 分 区 号 。 对 于 分 区 与 参数 ， 输 入 整数 (0 到 999 之 间 的 值 ) 以 对 应 
您 需要 监控 的 分 区 号 。 要 捕获 当前 已 连接 分 区 的 快照 ， 请 输入 值 - 1 或 NULL。 要 
捕获 分 区 数据 库 所 有 分 区 快照 ， 请 输入 值 - 2。 

使 用 下 面 的 语法 将 会 创建 引用 非 数 据 库 管 理 右 级 表 孙 数 的 查询 : 

SELECT * FROM TABLE (<FUNCctionName> (<DBName>, <PartitionNum>)) AS CorrelationName 

如 果 想 要 通过 使 用 快照 监视 器 的 表 函 数 MON_GET LOCKS 来 抓 取 当 前 连接 的 数据 库 

的 锁定 数据 的 信息 ， 可 以 执行 下 面 的 语句 ， 
SELECT * EROM TABLE (MON GET APPL LOCKWAIT (NULL,. —2}} AS LOCK INEO 


如 果 我 们 使 用 SAMPLE 数据 库 ( 先 前 的 例子 ) 作 为 当前 被 连接 的 数据 库 , 那么 执行 GET 
SNAPSHOT FOR LOCKS ON SAMPLE 命令 返回 的 信息 将 会 与 先前 表 函 数 监 控 非 党 相似 。 


3.4 性 能 管理 视图 及 案例 


DB2 提供 了 很 多 性 能 管理 视 钢 (这 些 性 能 管理 视 岁 关 似 Oracle 数据 库 中 的 以 开头 的 
动态 性 能 视图 )， 使 用 这 些 管 理 视图 可 以 获得 与 表 函 数 和 快照 类 似 的 监控 数据 。 表 3-2 列 出 
了 部 分 管理 视 网 ， 再 要 注意 的 是 这 些 视图 的 模式 名 都 是 SYSIBMADM。 我 们 可 以 使 用 db2 
list tables for schema sysibmadm 命令 来 获取 所 有 的 性 能 管理 视图 。 

同样 ， 在 这 些 视 图 中 能 够 获得 哪些 监控 数据 很 多 取决 于 监控 开关 的 设置 情况 。 
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表 3-2 DB2 的 部 分 管理 


当 


视 名 手 述 
APPLICATIONS SYSIBMADM 数据 库 中 运行 的 应 用 
每 个 应 用 中 rows selected 与 rows 
APPL PFRFORMANCE SYSIBMADM 
read 的 比率 
BP HITRATIO SYSIBMADM 缓冲 季 的 谷中 座 
BP READ IO SYSIBMADM 缓 诈 池 读 的 信息 
BP WRITE IO SYSIBMADM 缓冲 池 写 的 信息 
CONTAINER UTILIZATION SYSIBMADM 表 空 间 中 容器 的 利用 率 信 息 
LOCKS HELD SYSIBMADM 当 表 获得 的 锁 的 信息 
LOCKWAITS SYSIBMADM 锁 等 竺 的 信息 
LOG UTILIZATION SYSIBMADM 日 记 利 用 率 的 信息 
LONG RUNNING SQL SYSIBMADM 执行 时 间 最 长 的 SQL 
SNAPAGENT MEMORY POOL 四 ee 
SYSIBMADM 代理 级 别 的 内 存 使 用 情况 
SNAP GET AGENT MEMORY POOL 
SNAPBP Ce 
SYSIBMADM 缓冲 池 的 基本 信和 县 
MON BP UTILIZATION 
SNAPDYN SQL SYSIBMADM 数据 库 中 动态 SQL 的 执行 情况 
SNAPLOCKWAIT ER 
SYSIBMADM 饥 等 行 的 信和 县 
MON LOCKWAITS 
SNAPSTMT a 
SYSIBMADM 应 用 中 SQL 语句 的 执行 情况 
SNAP GET STMT 
SNAPTAB SYSIBMADM 衣 的 信息 
SNAPTAB REORG 本 
SYSIBMADM 重组 信息 
SNAP GET TAB REORG 
SNAPTBSP i 
SYSIBMADM 表 空 间 信 息 
MON TBSP UTILIZATION 
TBSP UTILIZATION SYSIBMADM 表 空 间 的 利用 情况 
TOP DYNAMIC SQL i se 
SYSIBMADM 消耗 资源 最 多 的 SQL 语句 信息 
MON _ CURRENT SQL 
MON PKG CACHE SUMMARY SYSIBMADM PACKAGE 命中 率 信息 
MON CURRENT UOW SYSIBMADM 当前 UOW 事务 信息 
MON WORKLOAD SUMMARY SYSIBMADM WORKLOAD 信息 汇总 
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( 续 表 ) 
视 图 名 模式 名 朱 述 
MON CONNECTION SUMMARY SYSIBMADM 数据 库 联 系 信息 
MON DB SUMMARY SYSIBMADM 数据 库 信息 


表 3-2 列 出 了 一 些 主要 的 视图 ， 这 些 视图 以 较 好 的 方式 将 快照 获得 信息 进行 良好 的 组 
织 ， 使 获得 一 些 性 能 的 信息 变 得 简单 容易 。 下 面 我 们 举 一 些 示例 。 


3.4.1 ”监控 缓冲 池 命 中 率 
我 们 利用 图 3-1 中 的 SQL 语句 来 监控 缓冲 池 的 命中 率 。 


select substr (bp name,l1,30) as bp name ， 
data hit ratio percent, 
index hit ratio percent  ， 
total hit ratio percent 
from sysibmadm.bp hitratio 
Where bp name not like 'IBMSYSTEMS' 


BP MAME DATA HIT RATIO PERCENT INDEX HIT RATIO PERCENT TOTAL HIT RATIO PERCENT 


TBMDEFAULTEBP 
CLPBUFEL 
GGPBUFEFS 


如 果 绥 冲 池 的 物理 读 大 于 逻辑 读 ， 那 么 这 个 


值 是 负 值 


图 3-1 ”监控 缓冲 池 命 中 率 


使 用 如 下 语句 但 看 当前 数据 库 绥 神 池 的 同步 和 开 步 谈 写 情况 : 


select substr (bp name,1,20) as bp name, int ((1- (decimal (pool data p reads) 


”flpaol data LL reads, 01*100) as data hi rato. rt (qecmalposld 


index p reads}) /nullif (pool index 1 reads,0}))})}*100) as index hit ratio, int 


((1- (qdqeclmal (pool data p reads+pool index p reads) /nullif((pool data 1 read 


spoo ndex | reads}) .07}})*100) as BP ht rator ant ((1 (dscemal (pool asyne 


data reads+pool async index reads) /nullif((pool async data reads+pool async 
iner readstiIrrect Teads)y nb )) 100) las nasync Pead PCE ne (Tl decimal 

(direct writes) /nullif (direct reads ,0)))*100) as Direct RW Ratijo from TABLE 
(MON GET BUFFERPOOL('"',—2)) as snapshot bp where bp name not like 'IBMSYSTEMS"; 
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渝 出 信息 如 下 : 


BP NAME, DATA HiT RATIQ INDEA HIT RATIQ BP HIT RATIO ASYNC READ PCT DIRECT RW RATIO 


TBMDEFAULTBP 汪汪 99 99 99 99 
BE S32 3:7 98 人 


3.4.2 监控 Package Cache 大 小 


可 以 利用 如 下 SQL 语句 来 监控 应 用 程序 包 的 大 小 ， 其 中 PKG CACHE LOOKUPS 表 
示 执 行 计划 在 程序 包 中 直接 从 Package Cache 中 查找 的 次 数 , PKG CACHE INSERTS 表示 
由 于 应 用 程序 包 组 存 中 没有 存在 SQL 语句 的 执行 计划 而 需要 重新 插入 的 次 数 。 
select DECENMRAE (人 — € PRG CACHE INSERTS *1.0 也 民生 CACHE EOQOKUPS },. 3. 2) 
as PKG CACHE HIT, PRKG CACHE NUM OVERFLOWS, 


PKG CACHE SIaE TOP 
Iirom SYSIBMADM .SNAPDB; 


输出 如 下 : 


PKG CACHE HIT PKG CACHE NUM OVERFLOWS PKG CACHE SILIaE TOP 


0 .89 U T3130 


1 record(s) selected. 
3.4.3 监控 执行 成 本 最 高 的 SQL 语句 


可 以 使 用 性 能 管理 视 网 来 监控 高 成 本 应 用 程序 。snapappl 视图 可 以 帮助 我 们 监控 可 能 
正在 执行 大 型 表 扫 摘 操 作 的 应 用 程序 : 


Select agent 1id,rows selected,rows read from sysibmadm.snapappl order by 
raws road Tooc teteh Frat 0 Toms onlys 


rows selected 表示 返回 给 应 用 程序 的 行 数 ，rows read 表示 在 基本 表 中 访问 的 行 数 。 如 
采 选 择 率 很 低 ， 那 么 表示 该 应 用 程序 可 能 正在 执行 表 扫 描 操 作 ， 通 过 创建 案 引 可 以 避免 应 
用 程序 执行 该 操作 。 使 用 此 视图 来 标识 可 能 有 问题 的 查询 ， 然 后 可 以 进行 进一步 调查 ， 查 
看 SQL 执行 计划 以 确定 是 否 能 够 减少 得 询 在 执行 时 谈 取 的 行 数 。 
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3.4.4 ”监控 运行 时 间 最 长 的 SQL 语句 


我 们 可 以 使 用 LONG_RUNNING SQL 管理 视图 来 监控 当前 正在 执行 的 运行 时 间 最 长 
的 会 询 ， 如 图 3-2 所 示 。 


select substrlappl name, 15) as Appl name ， 
elapsed time min as "Elapsed Min." ， 
appl status as "Status ", 
substr (authid,1,10) as auth id ， 
substr(inbound comm address,1,15) 

as "IP Address", 
substr (stmt text,1,30) as "SQL Statement" 
from sysibmadm.long running sgl 
order by 2 desc ; 


ABPPL NAME Elapsed Min. Statug AUTH_1ID | 


db2taskad " CONMNECTED INSTA461 
db2atmm " CONMECTED INSTA461 
db2bp 16 LOCKRWAIT INSTA461 
dbzbp 0 UOWWAIT INST461 
db2bp 0 UOWEXAEC INSTA461 
IE Address S00L Statement 


LOCAL, inastd61 update clpmn,.hiatl aet balances 
tLOCAL. inst461 update clpnmn.histl1 set balances 
LOCAL. instd461 select substr (appl name,l1,15) 


图 3-2 ”使 用 LONG RUNNING SQL 监控 运行 时 间 最 长 的 SQL 语句 


通过 使 用 此 视图 ， 我 们 可 以 监控 那些 查询 已 运行 的 时 间 长 度 以 及 这 些 查 询 的 状态 。 如 
末 肝 个 合 询 已 执行 了 很 长 时 间 并 且 正 在 等 待 锁 ， 我 们 还 可 以 使 用 对 特定 代理 程序 标识 执行 
但 询 的 LOCKWAITS 或 LOCK HELD 管理 视角 来 进行 进一步 调 盘 .LONG RUNNING SQL 
视图 还 会 指出 正在 执行 的 语句 并 允许 标识 可 能 有 问题 的 SQL。 

在 DB2 V10.5 中 ， 建 议 使 用 MON CURRENT SQL 来 百代 LONG RUNNING SQL 。 
在 MON CURRENT SQL 中 提供 了 更 多 的 正在 运行 的 SQL 的 信息 ， 包 括 ROWS READ、 
ROWS RETURNED 等 。 


3.4.5 ”监控 SQL 准备 和 预 编 译 时 间 最 长 的 SQL 语句 


可 以 使 用 QUERY_PREP_COST 来 对 已 确定 有 问题 的 查询 进行 故障 诊断 。 此 视图 可 以 
指出 查询 的 运行 频率 以 及 这 些 查 询 中 每 个 查询 的 平均 执行 时 间 ， 如 图 3-3 所 示 。 
PREP_TIME PERCENT 向 我 们 指出 准备 查询 时 耗 用 的 时 间 在 查询 执行 时 间 中 所 占 的 百 分 
比 。 如 果 编 译 和 优化 查询 时 耗 用 的 时 间 几 乎 与 查询 的 执行 时 间 一 样 长 ， 那 么 可 以 降低 优化 
级 别 使 该 查询 更 快 地 完成 优化 ， 从 而 更 快 地 返回 结果 。 但 是 ， 如 果 某 个 查询 需要 相当 长 的 
时 间 来 进行 准备 ， 但 要 执行 数 千 次 (而 不 必 再 次 进行 准备 )， 那 么 更 改 优化 并 不 能 提高 查询 
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SQL 语句 平均 执行 时 间 


select num executions, 
average execution time s ， 
prep time ms ， 


Drep time percent  ， 


预 编译 时 间 占 整个 执行 | 
| 时 间 的 百分比 ] 
substr (stmt text,l1,40) as "SQL Text" 
from sysibmadm.dquery prep cost ~ 
Where average execution time s > 0 |SQL 诸 句 文 本 
order by prep time percent desc; 


图 3-3 ”使 用 QUERY PREP COST 监控 SQL 准备 和 预 编译 时 间 
3.4.6 ”监控 执行 次 数 最 多 的 SQL 语 铝 


可 以 使 用 TOP_DYNAMIC SQL 视图 来 标识 执行 次 数 最 多 、 运 行 时 间 最 长 和 排序 次 数 
最 多 的 动态 SQL 语句 ， 如 图 3-4 所 示 。 有 了 此 信息 ， 我 们 在 进行 SQL 调整 工作 时 就 可 以 
把 注意 力 放 在 代表 东 些 最 大 资源 使 用 者 的 会 询 上 。 

Select num executions as "Num Execs", 
aVverade execution time 8 as "AVg Time (sec)™", 


stmt sorts as "Num Sorts", z 
sorts per execution as "Sorts Per Stmt", ™ 动态 SQL 语 句 的 执行 次 数 和 平 


substr (stmt text,1,35) as "SQL Stmt" 均 执 行 时 间 

from sysibmadm.top dynamic sql | 

where num executions > 0 从 top_dynamic_sql 管 理 视图 中 获取 
order by 1 desc Package Cache 中 的 动态 SQL 语 句 


fetch first 5 rows only; 


图 3-4 ”标识 运行 频率 最 局 的 动态 SQL 语句 


图 3-4 中 的 语句 返回 执行 频率 最 蜗 的 5 条 动态 SQL 语句 的 所 有 执行 时 间 、 排 序 执行 次 
数 和 语句 文本 详细 信息 ， 如 图 3-5 所 示 。 

为 了 标识 执行 次 数 最 多 的 动态 SQL 语句 ， 请 检查 AVERAGE EXECUTION TIME S 
值 最 大 的 5 个 查询 。 
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select num executions as "Num Execs", 


average execution time ss as "Avg Time (sec) ", 


stmt sorts as "Num Sorts"., 
SOrts per execution as "Sorts Per Stmt", 
gubstrlstmt text,l1,35) as "SOL Stmt" 
from sysibmadm.top dynamic sdql 
mn 

| 此 人 行 ， 并 目 同时 退 品 塘 
人 执行 次 数 ” 排 序 次 数 和 排序 时 间 


fetch first 5 rows only; 


Where num executions > 0 


图 3-5 返回 结果 


监控 排序 次 数 最 多 的 SQL 语句 


为 了 合 看 排 友 次 数 最 多 的 动态 SQL 语句 的 详细 信息 ， 发 出 以 下 语句 : 


select STMT SORTS, SORTS PER EXECUTION, substr (STMT TEXT,1,60)} as STMT TEXT 
from SYSIBMADM.TOP DYNAMIC SOQL 
arder by STMT SORTS desc fetfch frst 5 Poms Only? 


监控 锁 等 竺 时间 
可 以 通过 图 3-6 所 示 的 SQL 语句 监控 锁 等 待 时 间 ， 定 位 是 否 存在 严重 的 锁 等 待 。 


3.4.8 


3.4.9 


有 时 锁 等 待 会 造成 级 联 循环 ， 形 成 锁 和 


1 大 十 
In 


| 应 用 名 称 和 AUTH_ID 可 能 很 长 ， 为 了 便于 显示 ， 可 以 
使 用 substr 截 取 部 分 信息 


substr (ai.appl name,l1,20) as appl name ， 


substr (ai .Primary auth id,1,10) as auth id ， 

ap.lock waits as lock waits, 

ap.lock wait time / 1000 as "Total Wait (s)", 

(ap .lock Wait time / ap.lock waits ) as "Avg Wait (ms)" 


from sysibmadm,. snapappl info ai, sysibmadm.snapappl ap 


Where al.agent id = ap.agent id 


and ap.lock waits > 0,， snapappl_info 和 snapappl 两 张 视图 中 存放 美 于 应 用 
| 程序 相关 的 详细 监控 信息 


PPL_ MAME AUTH_ID LOCK_WAITS Total Wait (s) Avg Wait (mes) 


ab bp INST461 


PRY 
3 


图 3-6 监控 锁 等 待 时 间 


Lock Chaln 


环 链 (Lock Chaim)， 图 3-7 所 示 的 这 条 SQL 语 


句 可 以 定位 振 有 人 锁 和 等 竺 锁 的 应 用 。 
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谁 持 有 锁 ? 它 是 引起 镇 等待 的 原 办 


select substrlai h.appl name,l1,10) as "Hold App ， 
SUbstr (al hprimary auth 1d,1,10) as "Holder", 
substr (lw.appl] name,l1,10) as "Wait 及 PP 


substr (lw.authid,1,10) as "Waiter", 2 
本 - | 时 可 
lw. lock mode ， 谁 在 等 待 镇 ? 


lw.lock object type ， 
substr(lw.tabname,l1,10) as "TabName™, 
substr(lw.tabschema,l,10) as "Schema®", 


要 等 待 持 有 锁 的 应 用 释放 锁 


timestampdiff (2,char (lw.snapshot timestamp - lw.lock wait start time)) 
as "waiting (s)" 
把 lockwait、snapappl_info 和 snapappl 
“三 张 表 关联 起 来 就 可 以 定位 引起 镇 等 待 
sysibmadm.snapappl_ info al hh 的 SQL 语句 。 然 后 堂 试 为 该 SQL 语句 创 
where 建 合理 的 索引 、SQL 调 优 以 快速 释放 和 锁 
lw.agent id holding lk = al h.agent jid ; 


sysibmadm.lockwaits lw ， 


Walter sehema waiting (s} 


INSTA6 1 db2bp INST#461 


图 3-7 ”监控 Lock Chain 


为 外 还 可 以 通过 脚本 来 抓 取 锁 等 每 和 锁链 信息 ， 我 们 可 以 把 脚本 部 普 到 监控 系统 中 ， 
在 夜间 业务 系统 发 生 锁 等 每 时 ， 可 以 使 用 脚本 抓 取信 息 。 
如 下 是 抓 取 锁 等 每 信息 的 脚本 ， 供 大 家 参考 : 


#/bin/sh 
# Creation Date: 20]11.06.27 
# Version: 1.0 
# Modification History 
= 
db locks(})f{ 
cuUrrTime= "date" 
echo "Current fimer $1currTimer™ 
db=$1 
db2pd -aq $db ~wlock>$logdir/wlock.11st 
een ™ ™ 


ChO 去 友 支 去 砍 支 去 砍 坎 支 支 砍 支 支 砍 支 支 砍 支 支 支 支 支 呈 


scho "Current LockWait EF13t" 


己 ChO™M 支 支 支 支 支 砍 克 砍 吉 真 支 友 砍 砍 克 砍 吉 支 吉 支 雄 均 吉 真 坎 克 吉 支 支 吉 坎 砍 吉 走 南 克 支 砍 识 砍 砍 吉 支 支 支 砍 砍 志 砍 吉 支 页 支 克 均 克 喜 支 克 友 支 支 友 支 中 


cat $loqgdir/wlock.11ist 


ChO™W 支 支 去 云云 友 友 去 支 砍 支 支 砍 吉 支 砍 支 支 砍 支 页 友 支 雄 砍 砍 翰 克 砍 翰 克 砍 支 支 坎 吉 支 克 去 支 克 去 支 页 克 去 坎 砍 翰 吉 坎 翰 支 克 云云 砍 支 支 砍 支 支 支 支 用 


cat $logdir/wlock.1ist|lgrep -YY Locks|grep -1 Glawk ‘'{print $1}" 
>$logdir/holder 
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cat $logdir/wlock.1ist|grep -7 Glgrep -vv Locks|grep ~1 w lawk {print $1}' 
>$logdir/waiter 


#holder collect info 

echo "Collect the info for Holder Agent" 
CCho 了 用 汉 支 去 喜 去 吉 吉 吉 吉 翰 喜 吉 识 均 坎 吉 喜 翰 吉 坎 吉 吉 南 喜 喜 翰 吉 克 吉 翰 吉 吉 吉 均 克 鼓 喜 翰 喜 砍 吉 页 吉 嘉吉 吉 吉 坎 吉 吉 吉 嘉吉 砍 均 喜 吉 页 雄 支 圳 吉 支 中 

1d=0 

num="cat $logdir/holder|wc -1" 

while [ “$id™ -lt “$num"™ ] 

do 

d="axpr SId Fr 1 

agentid="'head -$1id $logdir/holder |tail -1| awk "'{print $1}"'" 

db2pd -qd $db -app $agentid > $agentid.txt 

CA="'grep $agentid $agentid.txt | sed -n '1p'" wk "1 BrIiNnE S78 
awk "{ print $8}"" 
awk "{ print $9}" 
Wk “1 Pranb S10 


CS="'grep $agentid $agentid.txt | sed -nn "1p' 
A=—"OQrep Sagentid Sagentid txt sed nT “1p 
LS="grep $agentid $agentid.txt | sed -n '1p' 
echo "Collect the dynamic sql to $agentid" 
iE | $CARY “ey IS) 0 | 
Ehen 
echo "db2pd -da $db -dyn lawk "flag==1 && /^*O0x/ {flag=0} flag==l1 {print} 
\$2==S$LA && \$3——$LS {print \$0;flag=1;}'"™ > 1.tmp 
Eh 


echo "db2pd -d $db -dyn |lawk "flag==l1 && /^0x/ {flag=0} flag==1 {print} 
\$2==$CA && \$3==$CS {print \$0;flag=1l;}'"™ >2.tmp 
echo | | A CE RC tC eT Eh A 人 人 Nn 


下 
#Getdyn $db $line |tee -a $logdir/hold.s$line.s$da 
done 
cho 用 去 支 去 吉 去 南 克 嘉吉 喜 均 砍 吉 页 吉 均 南 坎 吉 坎 吉 页 砍 喜 均 鞭 吉 商 吉 克 南 吉 南 坎 吉 丙 喜 吉 均 页 坎 均 识 南 吉 吉 南 吉 去 页 商 支 均 喜 均 喜 支 克 吉 支 吉 吉 支 用 


#waliter collect info 
echo "Collect the info for Waiter Agent" 
Echo 用 云云 云云 吉 支 吉 吉 均 吉 页 吉 页 均 喜 南 坎 页 吉 友 坎 吉 南 吉 吉 坎 克 识 吉 页 坎 克 吉 支 吉 喜 坎 坎 吉 翰 吉 砍 吉 吉 坎 吉 吉 支 喜 坎 吉 吉 去 志 翰 支 砍 吉 克 圳 均 支 支 支 串 
1d=0 
num="'cat $logdir/waiter|wc -1， 
while [| "Sd™ St | 
do 
I 


105 


DB2 数据 库 性 能 调整 和 优化 (第 3 版 ) 


agentid="'head -$1iqd $logdir/waiter |tail -1| awk '{print $1}"" 
db2pd -中 $db -app $agentid > $agent1id.txt 

CA="'grep S$agentid $agentid.txt | sed -nm ‘'1p' wk “Brant S/F 
a “{ Print SB} 
awK "{ Print $393" 
ank “"T PrInE S10 


| 
CS="'grep $agentid s$agentid.txt | sed -n "1p' | 
LA="'grep S$agentid s$agentid.txt | sed -n 'lp' | 
LS="'gqrep $agentid sagentid.tzxt | sed -ma "lp" | 
echo "Collect the dynamic sql to $agentid" 
if [ ${tCA} ~eq 0 -aa ${CS} ~eq 0 |] 
Enen 
echo "db2pd -d $db -dyn lawk "fl1ag==1 && /“^*O0x/ {flag=0} flag==] {print} 
\$2==$LA && \$3==$LS {print \$0;flag=1;}'" > 1.tmp 
Ee nm 


echo "db2pd -d $db -dyn |awk ‘flag==l1 && /^Ox/ {flag=0} flag==l1 {print)} 
\$2==$CA && “\$3==$CS {print \$0;flag=l;}'" >2.tmp 
Tt 


#getdyn $line |tee -a $logdir/wait.s$line.s$da 
done 
Echo 用 去 去 云云 吉 吉 克 吉 坎 支 喜 吉 吉 均 喜 南 吉 坎 坎 友 坎 吉 南 坎 吉 均 克 训 去 页 坎 克 丙 支 划 上 喜 吉 上 砍 吉 砍 吉 坎 雄 吉 坎 吉 吉 支 喜 吉 吉 坎 吉 志 喜 支 克 吉 克 吉 均 友 支 支 串 


- ${HOME}/-.profile 

today="date +$%m$d$M$®HS$SS' 

logdir=/tmp 

logfile=${logdir}/db locks $1 ${today} .1og 

eCho " 非 章 章 井 非 莫 莫 非 井 井 间 章 井 莫 井 间 井 提 间 捍 音 井 莫 井 井 捍 间 音 捍 间 音 井 井 井 间 音 井 井 井 井 井 井 井 间 #"” |tee>$ {logfile} 
echo "并 DB2 LOCKWAIT CHECK START...™ |tee>>s1 logf1ile)} 
eCho " 非 非 章 井 非 莫 莫 非 井 井 章 井 井 井 井 间 提 捍 音 间 捍 井 划 间 井 埋 捍 音 捍 音 井 井 间 捍 间 音 井 间 井 井 井 井 井 ###"” |tee>>${1logf1ile} 
db locks $1 |tee>>${logf1ile} 

eCho " 非 章 章 井 非 井 莫 非 # 井 章 井 井 井 井 间 井 埋 间 章 捍 井 划 间 间 埋 章 童 井 井 井 莫 并 井 间 井 井 井 井 莫 间 # 井 ##"” |tee>>$ {logfile} 
echo "# DB2 LOCKWAIT CHECK END..." |tee>>$ {logfile)} 
GChO " 非 非 章 井 非 莫 莫非 井 井 章 井 井 莫 井 间 提 捍 音 间 捍 井 划 间 井 埋 捍 音 捍 井 井 莫 埋 井 间 音 提 井 井 井 井 井 井 间 #"” |tee>>${1logf1ile} 
Cat s${logfile} 


3.4.10 ”监控 锁 内 存 的 使 用 
可 以 用 图 3-8 所 示 的 SQL 语句 判断 锁 内 存 的 使 用 。 
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locklist 显 示 的 单位 是 KB ， 而 
lock_list_in_use 的 单位 是 字 节 


with dbcfgl as i 

{ select float(int (value) * A4096) as locklist 
from sysibmadm.dbcfg where name = "locklist" }) ， 
dbcfg2 aes 

{ select floatl(int(value)) as maxlocks 

from sysibmadm.dbcfg Where name = maxlocks' ) 


| 使 用 了 多 心 镇 内 存 (locklist) ? 


select dec(l(llock list in use/locklist)*100,4,1) as "% Lock List", 
decl (lock list in use/ (locklist* (maxlocks/100}))})*100)} .4,1) 
as "% to Maxlock", rp 
appls cur cons as "Number of cons" | maxlocks 的 配置 大 小 龙 多 少 ? 
lock list in use/appls cur cons 
as "AVg Lock Mem Per Con (bytes)" 
from dbcfgl, dbcfg2 ， sysibmadm.snapdb ;} 


SS LOSk List % te Maxlock Number of Cone Avg Lock Mem Per Con (Bytes) 


图 3-8 ”监控 锁 内 存 的 使 用 情况 
3.4.11 监控 锁 升 级 、 死 锁 和 锁 超时 
图 3-9 所 示 的 SQL 语句 可 以 监控 锁 升 级 、 死 锁 和 锁 超 时 。 


select substr(ai.appl name,1,10) as Application, 
substr (al.primary auth id,1,10) as AuthID, 
int (ap.locks held) as "# Locks", 


int (ap.lock escals) as "Escalations", 


int (ap.lock timeouts) as "Lock Tijmeouts", 
int (ap.deadlocks) as "Deadlocks", 


int (ap.int deadlock rollbacks) as "Dlock Victim", 
substr(inbound comm address,1,15) as "IP Address' 


sysibmadm. snapappl ap, 
sysibmadm. snapappl info al 
here ap.agent id = al.agent id ; 


锁 等 待 ， 死 锁 和 锁 升 级 通常 和 应 用 程序 相关 。 


图 3-9 ”监视 锁 升 级 、 死 锁 和 锁 超时 
我 们 还 可 以 通过 如 下 语句 来 确定 东 个 表 上 有 哪些 锁 ， 并 列 出 这 些 锁 的 具体 信息 : 


SELECT trim(substr (RATABSCHEMA 1 8))115-5 11substr (ATABNAME ，1 ,15) as 
TABNAME, A.LOCK MODE,A.DBPARTITIONNUM,A.AGENT ID, SUBSTRI(B.APPL ID,1,10) AS 
APPL ID, B.CLIENT PID,SUBSTR(CLIENT PLATFORM,1;8)} AS CPLATFORM, 
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SUBSTR (B.CLIENT NNAME,1,8) AS CLIENT NAMP FROM SYSIBMADM.SNAPLOCK A, 
SYSTIBMADM .APPLICATIONS B WHERE A.AGENT ID = B.AGENT ID AND IABNAME= tapname'; 


A [| I 
输出 信息 如 下 : 
TABNAME, LOCEK MODE, DBEPARTITIONNUM AGENT 1D EAP ED 二 D CLIENT PLD CPLATFORM CLIENT NAME, 
SAPTOOLS -SCITATS SAP WLM IN 0 S02 LOCAL. DB2 3838192132 AITXEt4 BPMPPDDA 


3.4.12 ”监控 全 表 扫 摘 的 SQL 


图 3-10 所 示 的 SQL 语句 监控 数据 库 中 哪些 表 上 采用 的 是 全 表 扫 摘 方 式 。 


ROWS SELECTED 值 显示 返回 给 应 用 程序 的 行 
数 ，ROWS_ READ 值 显示 在 基本 表 中 访问 的 行 
数 。 如 果 选 择 率 很 低 ， 怠 袁 示 该 应 用 程序 可 能 
sibestr 【三 二 ho 1 10) as authid,. 正在 执行 全 表 扫 描 操 作 ， 党 试 创建 索引 来 避免 
_ 应用 程序 执行 全 甫 扫 揪 拘 作 。 
substr (appl name,l,20) as appl name ， 


percent rows selected 


from svysibmadm.appl performance : 


AULTHLD APBL NAME PERCENT ROWS_ SELECTED 


INST461 db2batch 
INST461 db2bp 
INST461 db2taskd 
INST461] db2stmm 
INST461 db2bpr 


图 3-10 ”监控 进行 全 表 扫 描 的 SQL 


除了 使 用 图 3-10 所 示 的 SQL 语句 来 监控 全 表 扫 描 的 表 ， 我 们 还 可 以 使 用 db2pd 工具 
来 监控 在 哪些 表 上 进行 了 全 表 扫 描 及 扫描 的 次 数 。 我 们 在 3.5 节 中 有 这 样 的 案例 。 


3.4.13 ”检查 页 清理 器 是 否 足 够 


页 清理 器 在 以 下 3 种 情况 下 触发 : 
e 绥 冲 池 中 的 脏 员 数量 达到 了 更 改 页 网 值 (CHNGPGS THRESH)。 
e 日 志 的 更 改 到 达 了 softmax 软 检 查 点 。 
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e 当 脏 页 被 选择 作为 牺牲 页 而 释放 bufferpool 空间 时 ， 页 清理 需要 把 脏 页 与 到 
便 盘 。 
图 3-11 所 示 的 SQL 语句 可 以 监控 数据 库 中 在 上 述 3 种 情况 下 页 清理 器 所 占 的 百分比 ， 
以 此 来 判断 是 否 配置 了 足够 的 页 清理 器 (num iocleaners)。 


注意 : 

如 果 把 DB2 注册 变量 DB2 USE ALTERNATE PAGE CLEANING 设置 为 ON 的 话 
(页 清除 程序 总 是 处 于 激活 状态 ， 不 用 等 待 条 件 值 触发 )， 图 3-11 中 的 这 条 SQL 语句 将 
无 效 。 


nn dp snap as 


( select 


float (Pool drty pg steal clns) as pg _ steal ， 

float (pool drty pg thrsh clns) as chg pg thrsh ， 

float (pool lsn gap clns) as softmax  ， 

float (pool drty pg steal clns + pool drty Po thrsh clns + 
pool lsn gap clns) as total clns 

from sysibmadm.snapdb |) 

找 出 是 什么 激活 了 页 清理 器 

select 

dec(( pg_steal / total clns) * 100 ,4,1 ) as "%® Steals ", 
dec(( chg pg thrsh / total clns) * 100 ,4,1 ) as "% Threshold ' 
dec(( softmax  / total clns) * 100 ,4,1 ) as "% Softmax " 
from db snap ; 


% Steals % Threshold % Softmax 


图 3-11 检 会 页 消 理 器 是 否 足 够 


3.4.14 ”监控 prefecher 是 否 足够 


图 3-12 所 示 的 SQL 语句 可 以 监控 数据 库 中 是 售 配 置 了 足够 的 异步 IO 服务 占 个 数 


(num loservers)。 
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3.4.15 


, Dp_snap as ( 
select substr (bp name,l1,30) as bp name ， 
Unread prefetch pages ， 
pecl async data reads + pool async index reads 
pool data p reads + pool index p reads + 


as ASync Reads ， 


pool temp data p reads + pool temp index p reads as Total Reads 


from sysibmadm. snapbp 
where bp name not like 
) 
select bp name, 
dec ( 100 * { Total reads - ASYnC reads ) 
/ Total reads ,95,2) as "% SYnch Reads", 
dec ( 100 * unread prefetch pages 


'TBMSYSTEM®'" 


Unread prefetch pages, 


/ Total reads ,5,2) as "% Unread Pages" 


异步 JO 服 务 器 预存 取 到 缓冲 池 
没有 使 用 的 页 | 
UNREAD PREFETCH PAGES % Synch Reads % Unread Pages 

IBMDEFAULTBP 


CLPBUFFL 
CLPBUFFS 


图 3-12 ”监控 prefecher 是 否 自 僻 
监控 数据 库 内 存 使 用 


图 3-13 所 示 的 SQL 语句 可 以 监控 数据 库 的 内 存 使 用 情况 。 


在 来 局 用 自动 内 存 调 优 (STMM) 
情况 下 数据 库 的 内 存 使 用 情况 。 


Select 


pool 1d, 


pool secondary 1d, 


pool current size, 


pool watermark 


1 

System 
System 
Systenm 
Syet em 


32k buffer pool 
lék buffer Becol 
Bk buffer pool 
aKk buffer Ecol 


POOL CUR S12E 
65536 
必 忆 迷 ] 生生 
65536 
171039360 
201192 
】 百 让 明慧 二 意志 
4390912 
T120896 
pe 
427680 
过 之 1 本 
0 
327680 
4325376 
131072 


图 3-13 ”监控 数据 库 内 存 使 用 情况 


POOL WATERMARK 
E5536 
过 看 加 二 是 遇 
65536 
171039360 
相 必 二 D1792 
过 
4390912 
T20896 
是 752 
327680 
和 62144 
0 
327680 
4325376 
131072 
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3.4.16 ”监控 日 志 使 用 情况 


图 3-14 所 示 的 SQL 语句 可 以 监控 数据 库 日 志 空 间 使 用 情况 


TT TT OT EE 
间 大 小 


int (total log used/1024/1024) as "Log Used (Meg)})™", 
int (total log available/1024/1024) 
as "Log Space Free (Meg)™", 
int((float(total loqg used) / 
float(total log used+i+total log avalillable))*100) 
已 "Pet Used", 
int (tot log used top/1024/1024) as "Max Log Used (Meg)™", 
int (sec lJ]og used top/1024/1024) as "Max Sec. Used (Meg)™", 
int (sec logs allocated) as "Secondaries" | 
from sysibmadm.snapdb } {_ 
日 忘 使 用 的 高 水 位 


已 可 Space Free{Meg) Pct Ugsed Max Log Used (Meg) Max Sec, Used (Meg) Secondaries 


图 3-14 ”监控 数据 日 志 空 间 的 使 用 情况 
3.4.17 ”监控 占用 日 志 空 间 最 旧 的 事务 


我 们 在 数据 库 中 经 常 碰 到 SQL0964C 报错 ， 通 常 这 个 错误 表示 日 志 空 间 满 ， 可 以 尝试 
分 配 更 多 的 日 志 空 间 。 但 造成 SQL0964C 还 有 另外 一 种 原因 : 在 日 志 空 间 并 未 用 尽 的 情况 
本 当 某 个 占有 最 旧 活 动 日 志 的 应 用 长 时 间 未 做 提交 操作 时 ， 会 阻止 日 志 的 LSN 的 分 配 ， 
造成 日 志 空 间 无 法 使 用 ， 这 同样 会 引发 这 一 日 志 满 的 报错 。 对 于 这 种 情况 ， 可 以 提交 该 事 
务 或 利用 FORCE 命令 终止 此 应 用 程序 ， 以 便 释 放 和 它 所 占用 的 日 志 空 间 , 使 LSN 可 以 继 
续 分 配 ， 空 闲 的 日 志 空间 可 用 。 图 3-15 所 示 的 SQL 语句 可 以 监控 数据 库 中 哪个 事务 持 
有 最 旧 的 活动 日 志 。 
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应 用 程序 状态 


select substr (ai.appl status,1,20) as "Status", 
substr (ai.primary auth id,1,10) as "Authid", 
substr(ai.appl] name,l1,15) as "Appl Name", 
int (ap.UOW LOG SPACE USED/1024/1024) as "Log Used (M)", 
int (ap.appl idle time/60) as "Idle for (min)™", 
ap.appl_con time as "Connected Since" 
from sysibmadm.snapdb db, 
sysibmadm. snapappl] ap, 哪个 事务 占有 最 旧 活 动 日 志 
syslilbmadm. ee info al 
where ai.agent id = db.APPL ID OLDEST XACT 
and ap.agent id = ai.agent id ; 


i 


AUthid Appl Mame Ly Used (My Idle for (min) Connected Since 


UCWWAIT INST#61 abp La 1 A0003-06=-22.08.54.783301 


图 3-15 ”监控 占用 最 旧 活 动 日 志 的 事务 


一 旦 定位 这 个 事务 ， 我 们 就 可 以 终止 这 个 事务 ， 或 者 查看 这 个 事务 的 详细 信息 ， 看 这 
个 事务 正在 执行 的 SQL， 从 而 帮助 我 们 进一步 定位 问题 所 在 。 


3.4.18 ”监控 存储 路 径 
图 3-16 所 未 的 SQL 让 名 可 以 监控 数据 库 表 空间 中 的 容器 行 储 路 全， 


SUubstr (path,1i,SO0) as path 
from sysibmadm.dbpaths 
order by type 


Fantabnas/inatarl HODBO0UG /BOLODOOL/ 
-dbauteo/patha/ 
-dbauteo/pathl,/ 
/database/ inst461/NODEOQO000/Bqldbdir)/ 
-database/ jnastd461l1/NODEOQOOO0O0/ SQLOO0O001/ SQLOGDIR/ 
TBSP CONTAINER -database inatd6l/NODEOOO0O0/ SOQLOO0O001/DMScl1Emd 
TEASP_ CONTAINER /database/instd6el/NODEOO000/SQLOO0O001/DMSclpm3 
TESP CONTAINER -database/ instdel1l/NODEOO000/ SQLO0001/DMSCLEPMS 
TERSEP CONTAINER -database/ inst461 /NODEOO000/SQLO0001/DMSclpml 
TBSE CONTAINER -database/ inet461 /MUSICDBE/tspo06 
TBEBSP CONTATNER -database/ dinaet461 /MUSICDB/ tsap03 
TESEP CONTATINER -database/ inatd61l/MUSICDB/tapo2 
TBEBSP CONTALINER -database/ inst461/MUSICDB/ tap0l 
TESP DIRECTORY -database/ inastdsel/NODEOQOOO0O0/ SOQLOOO00l1/Uutemp/ 
TESP DIRECTORY -database/ inst461 /MUSICDE/ tspo07/ 


图 3-16 ”监控 容器 的 存储 路 径 
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3.4.19 ”追踪 监控 历史 
图 3-17 所 示 的 SQL 语句 可 以 监控 数据 库 的 监控 历史 。 


3.5 


创建 您 自己 的 监控 历史 表 


create table con history as od 
( select snapshot timestamp, appls in db2, 


appls_ cur cons, agents_ top 
from sysibmadm.snapdb ) 
definition only 


insert into con history 

select snapshot timestamp, 
appls_in_ db2, 把 监控 的 信息 插入 该 表 中 ,便于 以 后 的 
Wi we wiia | 问题 诊断 和 性 能 调 优 
adgents top 


syslbmadm.snapdb ; 
图 3-17 监控 数据 库 的 监控 历史 


db2pd 


db2pd 是 新 的 实用 程序 ， 可 用 来 从 正在 运行 的 DB2 实例 或 数据 库 检索 统计 信息 ， 类 似 
于 Informix 的 onstat 实用 程序 。 该 工具 可 以 提供 大 量 有 用 信息 以 帮助 进行 故障 诊断 和 问题 
确定 、 性 能 提高 和 应 用 程序 开发 设计 ， 这 些 信 息 包 括 : 


操作 系统 、DBM 和 DB 配置 参数 
锁定 

绥 冲 池 

表 空 间 

容 骼 

动态 SQL 语句 

代理 进程 

应 用 程序 

内 存 池 和 内 存 集 

事务 
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es， 卓 南 

e 其 他 

该 工具 不 需要 获得 任何 锁 存 器 或 使 用 任何 引擎 资源 就 可 以 收集 这 些 信息 。 因 此 ， 当 
db2pd 收集 信息 时 ， 有 可 能 (并 且 预 计 会 这 样 ) 会 检索 到 正在 更 改 的 信息 ; 这 样 的 话 ， 数据 可 
能 不 是 十 分 准确 。 但 是 ， 在 不 加 锁 的 情况 下 收集 信息 有 两 个 好 处 : 检索 速度 更 快 并 且 不 会 
争 用 引擎 资源 。 
3.5.1 常用 db2pd 监控 选项 和 示例 


下 面 我 们 举 一 些 使 用 db2pd 进行 快速 故障 诊断 的 示例 。 
例 3-2 ”诊断 造成 锁 等 竺 的 表 上 的 加 锁 情 况 。 
首先 利用 db2pd -db musicdb -applications 命令 ， 定 位 status=Lock-Wait 的 应 用 程序 的 
人 句柄 AppHandl; 然后 再 根据 这 个 AppHandl 定位 事务 句柄 (CTranHd)， 然 后 我 们 再 根据 这 个 
事务 句柄 定位 所 在 的 表 及 表 上 的 加 锁 情 况 ， 如 图 3-18 和 图 3-19 所 示 。 
db2pd -db musicdb -applications 
Database Partition 0 -- Database MUSICDB -- Active -- Up 0 days 00:05:13 
Applications: 


Addregss AppHandl [nod-index] NumAgents CoorTid status Appld 


Ox0091FF30 00021] 1404 *LOCAL . INST45 .050413230634 
Ox0091EC50 131 00013] 2276 UOW-Waiting *LOCAL. INST45 .050413230250 
Ox0091EEFO 12 00012] 3840 UOW-Waiting *LOCAL. INST4> .05041323023» 


db2pd -dH musicdb -transactions 


Database Partiticon 0 -- Databaesee MUSICDB -- Active --. Up 0 days 00:14:31 


Transactions: 

Addrese ApHdHandl [nod-index] TranHAl Locks : LogSpace 
0x01DC1580 12 [000-00012] 3 1322290 
Ox01DC2000 13 [000-00013] = 


0x01DC2A80[21 | t000-00021) 


图 3-18 ”定位 事务 句柄 
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-transactions 


Database Partiticen 0 -- Database MUSICDB -- Active -- Up 0 days 00:14:3] 


Transactione: 
Addrass AppHandl] [noed-index] TranHd] Locks State LogsSpace 
Ox01DC1580 12 [O000-00012] 3 2 1322290 
13 [000-00013] 3 
| [000-00 


' Database MUSICDB -- Active -- Up 0 days 05:14:31 


Lockname Type Mode Sts Owner Dur Hldcnt Att Rlase 
S3514c4332453036bd4a326841 Internal BP 。。 3 | 0 0 x0 
53514c4332453036bd4a32c841 Internal P ..8 G 4d 
0d000400000000000000000054 Table 3 
0d000400000000000000000( 呈 4 Table 

01000000010000000100f30056 Internal V .. 

每 守 与 本 册 全 由 由 由 与 昌 百 过 它 与 生生 自 司 避 在 当心 让 站 二 工科 七 号 工 忆 去 上 P 。 


图 3-19 ”根据 事务 句柄 (TransHd]l) 来 定位 表 上 的 加 锁 情 况 


例 3-3 诊断 锁 超 时 。 
使 用 db2pd -db sample -locks -transactions -applications -dynamic 命令 可 获取 下 列 结果 : 


锁定 : 
Address TranHdl Lockname Type Mode Sts Owner Dur Hldcnt Att ReleaseFlg 
0x07800000202E5238 3 00020002000000040000000052 ROW ..X G 3 1 
0x0000 0O0x40000000 
0x07800000202E4668 2 00020002000000040000000052 ROW ..X W* 3 1 0 


UXUUUU Ox40000000 


对 于 使 用 -db 数据 库 名 称 选 项 指定 的 数据 库 ， 开 头 的 结果 会 显示 该 数据 库 的 锁定 。 您 
会 及 现 工 gh 2 正在 等 + 答 a 3 挂 起 的 锁定 。 其 中 52 表示 行 锁 ，54 表示 表 锁 ，W# 
表示 锁 等 竺 超时，W 表示 正在 等 每 锁 。 


本 
Address APPHandl [nod-index] TranHdl Locks State Tflag Tflag2 
FirSliSn Lastlsn LOgSpace SpaceReserved TID AxRegCnt GXID 
0x07180000020231B80 11 [000-00011] 2 4 READ Ox00000000 0x00000000 
0Qx000000000000 0x000000000000 0 0 Ox0000000000B/ 1 0 
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UXU 180000020222900 12 [000-00012] 3 4 WRITE Ox00000000 0xX00000000 
0Qx000000FAQ000C Ox000000FAO000C 113 1 54 Ox0000000000B8 1 U 


您 会 上 友 现 TranHdl 2 与 AppHandl 11 相关 联 ， 而 TranHdl 3 与 AppHandl 12 相关 联 。 


应 用 程序 : 

Address AppHandl [nod-index] NumAgents CoorPid Status C-AnchID 
C-StmtUID L-AnchID 工 -StmtUID Appid 

UXU /8000000068 19EU 12 [000--00012] 1 10 13336 UoOW-Waiting 0 0 
117 1 *LOCAL. burford.060303222602 

UXU 8000000068JE80 11 [O000—00011|] 1 10405 /10 UOW-Executing 17 1 
94 1 *LOCAL.burford.060303222601 


~ AppHandl 12 最 后 运行 动态 语句 17、1，ApplHandl 11 当前 正在 运行 的 动态 
君 句 是 17、1， 而 最 后 运行 的 语句 是 94、1。 


动态 SQL 语句 : 
Address AnchID StmtUID NumEnyv NumVar NumRef NumExe Text 
Ox07800000209FD800 17 1 1 1 2 2 update SAMPLE set cl1 = 5 
0x07800000209FCCC0 94 于 ] 让 2 2 set lock mode to wait 1 


你 会 发 现 ， 文 本 (Texb 列 显示 与 锁定 超时 相关 联 的 SQL 语句 

3-4 使 用 -wlocks 选项 捕获 所 有 正在 等 待 的 锁定 

在 下 面 的 样本 输出 中 ， 应 用 程序 (AppHandl 47) 正 在 执行 插入 操作 ， 而 应 用 程序 2 
(AppHandl 46) 正 在 选择 该 表 : 


prod@sapr3:/home/prod =>db2pd -db SAMPLE -LocKS wait 


Database Partition 0 -- Database SAMPLE -- Active -- Up 0 days 04:20:59 
LOCKksS: 
Address TranHdl Lockname Type Mode SLS Owner Dur 
HoldCount ALt ReleaseF lg 
0x /1F8AO0DBO J 02000600040040010000000052 ROW .NS W 2 1 
0 OQ0x00 Ox00000001 TbspacelID 2 TablelID 6 

PartitionID 0 Page 320 Slot 4 
Ox/F8ALTI1T80 2 02000600040040010000000032 ROW SE 《和 1 
0 UXUU Ox40000000 TbspacelID 2 TablelID 6 


例 3-5 监控 动态 SQL 语句 。 
db2pd -applications 命令 报告 动态 SQL 语句 的 当前 及 最 后 一 个 销 点 标识 和 语句 唯一 标 
识 ， 这 人 允许 直接 从 应 用 程序 映射 全 动态 SQL 语句 。 


db2pd -ao sample -app -dyn 


应 用 程序 : 

Address AppHandl [nod-index] NumAgents CoorPid Status 
0Qx00000002006D2120 i180 [000-007180] 1 1061» UOW-Executing— 
应 用 程序 状态 

C—-AnchID C-StmtUID L-AnchID L-StmtUyID Appid 

163 1 110 1 LOCAL .burford.030202200412 

动态 SQL 语 何 ; 

Address AnchID StmtUID NumEnv NumVar NumRef ME 天 全 Text 


0x0000000220A02160 163 1 2 i select ”From emlovee 
Ox0000000220A0B460 110 1 2 2 1 update employee set salary=1234 


例 3-6 确定 哪个 应 用 程序 使 用 了 大 量 表 空 间 。 
通过 使 用 db2pd -tcbstats 命令 ， 可 以 标识 对 表 执 行 插入 操作 的 次 数 。 以 下 是 用 户 定义 


的 全 局 临时 表 TEMP1 的 样本 信息 : 

TCB 去 情 品 : 

Address TbhbspaceID TablelID PartID MasterTbs MasterTab TableName 

SchemaNm ObjClass DataSlze LfSize LobSize XMLS1ize 

0x0 /180000020B62AB0 3 2 n/a 3 TEMP1 SESSION 

Temp 3966 U 0 0 

TCB 表 状 态 : 

Address TableName Scans UDI PgReorgs NoChgUpdts Reads 

FSscrUpdates Inserts Updates Deletes OVEReadads OvFE1lCrtes 
0x0780000020B62AB0 TEMP]1 0 0 U U U 0 

43968 UO 0 0 0 


然后 ， 可 以 通过 db2pd -tablespaces 命令 获取 表 空 


司 3 的 信息 。 样 本 输出 如 下 所 示 : 


Address Type Content PageSsz ExtentSz Auto Prefetch BufID BufIDD1isKk FSC 
NumCntrs MaxSstripe LastConsecPg Name 

0x0780000020B1B5A0 DMS UsrTmp 4096 32 Yes 32 ] ] on 

1 0 31 TEMPSPACE? 

表 空 间 3 统计 信息 : 

Address TotalPgs UVUsablePgs UsedPgs PndFreePgs FreePgs HWM 
State MinRecTime NOulescers 

0x0 180000020B1BSA0 5000 4960 1088 0 3872 1088 
0x00000000 0 0 

表 空 间 3 自动 调整 大 小 统计 信息 : 

Address AS AR InitSsize IncSize IIP MaxSize LastResize LRF 
UXU 180000020B1BJA0 No No 0 U NO 0 None NO 
容器 : 

Address ContainNum Type TotalPgs UseablePgs StripeSet Container 
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0x0780000020B1DCCO0 0 File 5000 4960 0 /home/db21instl1/tempspace2a 


您 会 注意 到 通过 引用 FreePgs 列 填 满 的 空间 。 因 为 可 用 页 数 下 降 ， 所 以 可 用 空间 减少 。 
还 应 注意 ，FreePsgs 加 上 UsedPsgs 的 值 将 等 于 UsablePgs 的 值 。 
一 旦 了 解 了 这 一 点 ， 您 就 可 以 标识 使 用 表 TEMP1 的 动态 SQL 语句 : 


db2pd -ab sample -dyn 
数据 库 分 区 0 -- 数据 库 SAMPLE -- 活动 -- 正常 运行 0 天 00:13:06 


动态 高 速 缓存 : 

当前 使 用 的 内 存 1022197 

堆 总 大 小 1271398 

高 速 缓存 溢出 标志 0 

引用 数 237 

语句 插入 数目 32 

语句 删除 数目 13 

变动 插入 数目 21 

语句 数目 19 

动态 SQL 语句 : 

Address AnchID STtmtUID NumEnv NumVar NumRef NumExe Text 
Ox0000000220A08C40 /1718 1 2 2 3 2 declare global 
temporary table templ (cl char(6)) not logged 

Ox0000000220A8D960 253 1 1 下 24 ”4 insert into 


session.templ values('TEST'"') 
最 后 ， 可 以 将 它 映射 全 db2pd -app 输出 以 标识 应 用 程序 : 


应 用 程序 : 
Address AppHandl [nod-index] NumAgents CoorPid Status 
0x0000000200661840 501 [000-00501] 1 11246 UOW-Waiting 
C-AnchID C-StmtUID L-AnchID -StmtUID Appid 

0 0 253 下 *LOCRAL .Gb21nst1.050202160426 


针对 先前 使 用 的 db2pd 中 的 动态 SQL 语句 的 请 求 产生 的 销 点 标识 (AnchID), 将 与 针对 
关联 应 用 程序 的 请 来 一 起 使 用 。 应 用 程序 结果 显示 最 后 一 个 销 点 标识 (L-AnchID) 与 该 销 点 
标识 (AnchID) 相 同 。 一 次 运行 db2pd 产生 的 结果 将 在 下 一 次 运行 db2pd 时 使 用 。 

db2pd -agent 的 输出 将 显示 应 用 程序 谈 取 的 行 数 (Rowsread 列 ) 和 与 入 的 行 数 (Rowswrtn 
列 )。 这 些 值 将 显示 应 用 程序 已 完成 的 部 分 及 疝 未 完成 的 部 分 : 


Address AppHandl [nod-index] AgentPid Priority Type DBName 
Ox0000000200698080 501 [000-00501] 11246 0 Coord SAMPLE 
state ClientPid Userid ClientNm Rowsread Rowswrtn LkTmOt 
Inst-Active 26377 db2inst1 db2bp 22 9588 NotSet 
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db2pd -agent 请 求 中 的 AppHandl 和 AgentPid 的 值 可 映射 回 db2pd -app 请 求 中 的 
AppHandl 和 CoorPid 的 对 应 值 。 

如 条 您 怀疑 内 部 临时 表 丘 满 了 表 衬 间 ， 那 么 上 面 这 些 步 骤 会 稍 有 人 不同。 仍然 可 以 使 用 
db2pd -tcbstats 来 标识 具有 最 大 插入 数目 的 表 。 以 下 是 隐 式 临时 表 的 样本 信息 : 


TCB 表 信 息 : 

Address TbhbspaceID TablelID PartID MasterTbs MasterTab TableName 
SchemaNm Ob]JjClass DataSize ... 

0x07180000020CC0D30 1 下 n/a 1 2 TEMP (00001,00002) 
< 3D> <JMC Temp 2410 

0x0 180000020CC14B0 1 3 n/a ] 号 TEMP (00001,00003) 
“3E™> <JMC Temp 2361 

0x0 780000020CC21B0 上 4 n/a . 4 TEMP (00001,00004) 
有 一 <JMC Temp 1812 

TCB 表 状 态 : 

Address TableName Scans UDI PgReorgs NoChgUpdts Reads 
FscrUpdates Inserts 

0x0 180000020CC0D30 TEMP (00001,00002) 0 0 0 0 0 0 43219 

0x0 180000020CC14B0 TEMP (00001,00003) 0 0 0 0 0 U 42485 

XU /180000020CC21B0 TEMP (00001,00004) 0 0 0 0 0 U 


在 此 例 中 ， 使 用 命名 约定 “TEMP (TbspaceID, TableID)” 的 表 中 有 大 量 插入 。 这 些 是 
隐 式 临时 表 。SchemaNm 列 中 的 值 的 命名 约定 为 AppHandl 的 值 与 SchemaNm 的 值 并 和 置 ， 
这 使 得 它 能 够 标识 正在 工作 的 应 用 程序 。 

然后 ， 可 以 将 这 些 信息 映射 至 db2pd -tablespaces 产生 的 输出 ， 以 查看 表 衬 间 1 的 已 使 
用 衬 间 。 在 表 衬 间 统 计 信 息 中 记 下 已 使 用 的 页 数 与 可 用 页 数 之 间 的 关系 。 


表 空 间 配 置 : 

全 Id Tvpe Contkent Pagesz Extentsz Auto Prefetch Buf 1D 
BufIDDisk FSC NumCntrs MaxStrlpe LastConsecPg Name 

Ox07800000203FB5A0 1 SMS SysTmp 4096 32 Yes 320 ] ] 
on 10 0 3 TEMPSPACE]l 

表 空 间 统计 信息 : 

Address Id TotalPFgs UsablePrgs UsedPgs PndFreePgs FreePgs 
HWM state MinRecTime NOulescers 

Ox07800000203FB5A0 1 6516 6516 6516 0 0 
0 0x00000000 0 0 

表 空 间 日 动 调整 大 小 统计 信息 : 

Address Id AS AR Initsize IncSize IIPMaxSize LastResl1ze LRF 

Ox0 1800000203FB2A0 1 No No 0 U NO 0 None NO 
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容 骨 : 


然后 ， 可 以 使 用 命令 db2pd -app 标识 应 用 程序 句柄 30 和 31( 因 为 它们 出 现在 -tcbstats 
输出 中 ): 


应 用 程序 : 

Address AppHandl [nod-index] NumAgents CoorPid status 

C—ANnCNID C-StmtUID L-AnchID L-StmtUID Appid 

UXU 1800000006FB880 31 [000-00031] 1 4184182 UOW—Waiting 0 
0 107 1 *LOCAL.db2inst1.051215214142 

UXU 17800000006F9CE0 30 [000-00030] 1 89662 1 UOW-Executing 107 
1 107 1 *LOCAL.db2inst1.051215214013 


最 后 ， 使 用 db2pd -dyn 命令 将 它 映射 至 动态 SQL: 


动态 SQL 语句 : 
Address AnNnChID StmtUID NumEnyv NumVar NumRef NumExe Text 
Ox0 T80000020B2936C0 101 1 1 1 43 4 
号 全 Le Cle C2 Erom test group Dy cli C2 


例 3-7 监视 全 表 扫描 的 表 。 
发 出 db2pd -tcbstats 命令 ， 可 以 查找 发 生 过 的 全 表 扫 描 的 表 ， 如 下 所 示 : 


C:\> db2 connect to sample 

数据 库 连 接 信息 

数据 库 服务 器 = DB2/AIX64 11.1.1.1 

SQL 授权 标识 = DB2INST1 

本 地 数据 库 别 名 = SAMPLE 

C:\> db2 select * from 七 estl -----—- test1 上 没有 有 索引， 执行 一 次 全 表 扫 摘 


TD 


2 条 记录 已 选择 。 
C:\> db2 select * from testl1 ------- test1 上 没有 索引 ， 执 行 第 二 次 全 表 扫 描 
TD 


2 条 记录 已 选择 。 
C:\> db2 select * from test2 ------- test2 上 没有 索引 ， 执 行 一 次 全 表 扫 措 
TID NAMEJL 
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1] rhetteaaa 

2 danielbbb 

2 条 记录 已 选择 。 

C:\> db2pd -db sample -tcbstats 

Database Partition 0 -—— Database SAMPLE -- Active -- Up 0 days 00:15:24 
TCB Table Information: 

Address TbhspacelD TablelD PartID MasterTbs MasterTab TableNameSschemaNm 


Ox7TEAF1920 0 7 n/a 0 7 SYSINDEXES SYSIBM 
OxXTEAF38A0 3 6 n/a 3 6 TEST1 DB2INST1 ------ 表 TEST1 存在 全 表 扫 描 
0x7ERAF41RA0 3 7 n/a 3 7 TEST2 DB2INST1 ------ - 表 TEST2 存在 全 表 扫 描 


0X 7EAABBAO 0 13 n/a 0 13 SYSPLAN SYSIBM 


TCB Table Stats: “-_---- 查 看 全 表 扫 描 的 详细 信 息 


Mddress TableName Scans UDIL RTSUDIT PgqReorgs 


Ox7EAF1920 SYSINDEXES 0 309 309 0 

0x7EAF38A0 TEST1 2 0 0 0 --- 表 TEST1 全 表 扫 描 两 次 
0x7EAF41A0 TEST2 1 0 0 0 --- 表 TEST2 全 表 扫 描 一 次 
Ox7EAABBAO SYSPLAN 0 2 2 0 


命令 成 功 完 成 ， 部 分 输出 结 末 如 上 上 所 示 。 码 看 都 有 哪些 表 友 生 了 表 扫 朱 ， 可 以 看 输出 
结果 中 的 “TCB Table Information” 部 分 ，TableName 部 分 显示 了 发 生 过 全 表 扫 摘 的 表 的 名 
字 。 如 果 要 但 看 全 表 扫 描 发 生 的 次 数 ， 可 以 查看 TCB Table Stats 部 分 。 
例 3-8 监视 恢复 。 
命令 db2pd -recovery 显示 了 几 个 可 用 于 验证 是 否 正在 进行 恢复 的 计数 器 : 当前 日 志和 
当前 LSN 提供 了 日 志 位 置 ， 已 完成 的 工作 ， 计 算 目 前 已 完成 的 字 节 数 。 


恢复 : 

恢复 状态 0x00000401 

当前 日 记 S0000005 .LOG 

当前 LSN 000002551BEA 

作业 类 型 ROLLFORWARD _ RECOVERY 
作业 标识 7 

作业 开始 时 间 (1107380474) Wed Feb 2 16:41:14 2014 
作业 描述 数据 库 前 滚 恢 复 

调用 程序 类 型 用 户 

总 阶段 2 

当前 阶段 j 

进度 : 
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地 址 阶段 号 描述 ”开始 时 间 己 完 成 的 工作 总 工作 
0x0000000200667160 1 向 前 Wed Feb 2 16:41:14 2005 2268098 字 节 未 知 
0x0000000200667258 2 回 后 “NotStarted 上 未 知 


用 的 日 专 宇 间 和 保留 这 对 于 了 解 事务 行为 很 有 用 。 

旦 和 

adeess AppHandl [nod-—index] TranHdl Locks State Tflag 

0x000000022026D9380 71797 [000-00797] 2 108 WRITE Ox00000000 

0x000000022026E600 806 [000-00806] 3 二 WRITE Ox00000000 

0x000000022026F280 807 [000-00807] 4 90 WRITE Ox00000000 

Tflag2 FiTsitlsn Lastlsn LogSpace SpaceReserved 

Ox00000000 0O0x000001072262 0x0000010B2C8C 4518 95450 

Ox00000000 0O0x0000010575714 0x0000010B3340 6576 1396710 

Ox00000000 Ox0000010JCFOC Ox0000010B2FDE 3762 19266 

TI AxRegCnt GXID 

Ox000000000451 1 0 

0x0000000003E0 1 0 

Ox000000000472 1 0 

例 3-10 监视 日 志 使 用 情况 

命令 db2pd -logs 对 于 蝴 视 数据 库 的 日 志 使 用 情况 很 有 用 。 观察 已 写 入 的 页 面 输 
出 ， 可 以 确定 是 否 正在 使 用 日 志 。 

Logs: 

Current Log Number i 

Pages Written 5698 

Cur Commit Disk Log Reads 0 

Cur Commit Total Log Reads 1 54 

Method 1 Archive Status n/a 

Method 1 Next Log to Archive n/a 

Method 1 First Fallure n/a 

Method 2 Archive Status n/a 

Method 2 Next Log to Archive n/a 

Method 2 First Fallure n/a 

Log Chain ID 0 

CUurreaent ESN 0x00000067121A46951 

Address StartLSN state Size Pages Filename 


例 3-9 确定 事务 正在 使 用 的 资源 量 。 


命令 db2pd -transactions 提供 了 锁定 数 、 第 一 个 日 志 序 号 LSN)、 最 后 一 个 LSN、 已 使 
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UXU O00000A004C290 00000067114410010 0x00000000 16380 16380 S0000008 .LOG 
UXU 000000A004CAFO 0000006/111840C0O10 0x00000000 16380 16380 S0000009 .L0G 
Ox0 000000A004D330 0000006/71C408010 0x00000000 16380 16380 S0000010 .LOG 
Ox0 O000000A004DBB0 00000067120404010 0x00000000 16380 16380 S0000011 .LOG 
Ox0 O00000A004E410 0000006/124400010 0x00000000 16380 16380 S0000012 -LOG 


使 用 此 输出 可 以 确定 两 个 问题 : 

e 如果 归 档 存 在 问题 ， 那 么 Archive Status 将 显示 为 Faillure， 表 示 最 近 的 日 志 归 档 失 
败 。 如 果 正 在 发 生 的 归档 失败 导致 根本 无 法 归档 日 志 ， 那 么 将 显示 First Failure。 

e 如果 日 志 归 档 速度 非常 慢 ， 那 么 下 一 个 要 归档 的 日 志 值 将 小 于 当前 日 志 编 号 。 这 
可 能 导致 填 满 日 意 路 径 ， 从 而 在 完全 填 满 日 志 路 径 时 防止 数据 库 中 出 现任 何 数据 
更 改 。 

例 3-11 收集 操作 系统 信息 。 

通过 发 出 db2pd-osinfo 命令 ,我 们 可 以 方便 地 获取 操作 系统 的 一 些 配置 信息 和 运行 信息 : 


Ahomeydb21nst17sdql11bydb2dumpsdb2pdq -oslnfo 
Operating System Information: 

OSName: 及 工人 

NodeName: RBPPTRN 

VYersion: © 

Bo 

Machine: 000D655AD400 


CPU Information: 
TotalCPU OnlineCPU ConfigCPU Speed(MHz) HMTDegree Cores/Socket 
64 16 64 3000 4 n/a 


Physical Memory and Swap (Megabytes): 
TotalMem FreeMem AvallMem Totalswap Freeswap 
321068 3873 n/a 16384 2210 


Virtual Memory (Megabytes): 
Total Reserved Avallable Free 
49152 n/a n/a 16143 


Message Queue Information: 
MSGSed MsqgqMax MsgMap MsqMn1 MsgTql MsgMnb MsgSsz 
n/a 4194304 n/a n/a n/a 4194304 n/a 


shared Memory Information: 
ShmMax ShmMin shmIds ShmSed 
68719476736 1 131072 0 
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Semaphore Information: 


SemMap SemMn1 emMns SemMnu SemMs1 JSemoOpm SemUme 
semUSZ DeImVITX SemAem 

n/a 131072 n/a n/a 65535 1024 n/a 
n/a 32161 16384 


CPU Load Information: 
Short Med1ium Long 
-O04d59822 |- 卫生 天 1.220459 


CPU Usage Information (Percent) : 
Total Usr SYS Walt Idle 
12.625000 11.312500 0.500000 0.812500. 87.375000 


从 上 面 收集 的 信息 我 们 可 以 看 到 操作 系统 的 版 本 、CPU 配置 、 物 理 内 存 、 虚 拟 内 存 、 
消息 队列 、 共 享 内 存 、 信 号 灯 等 信息 。 其 中 上 面 列 出 的 消息 队列 、 共 享 内 存 、 信 和 号 灯 都 是 
与 该 DB2 实例 相关 的 信息 。 

例 3-12 使 用 db2pd -dbmcfg 命令 ， 收 集 数 据 库 管理 需 配 置 参 数 。 


/home/db21inst1ls$ db2pd -qdqbmcfdg 


Database Partition 0 -- Active -- Up 0 days 01:29:15 
Database Manager Configuration Settings: 

Description Memory Value Disk Value 
RELEASE 0xa00 OQ0xa00 
CPUSPEED J.8225219e—01 9:8225 47193e—01 
COMM BANDWILIDTH 1 .000000e+02 1 .000000e+02 
NUMDB 9 8 

DATALINKS NO NO 
FEDERATED 开本 YES 


从 中 我 们 可 以 看 到 数据 库 管理 器 的 运行 时 间 、 所 有 的 配置 参数 ， 其 中 Memory Value 
为 当前 值 ，Disk Value 为 下 一 次 司 动 DB2 实例 生效 的 值 。 

例 3-13 ”收集 数据 库 配 置 参数 。 

使 用 -dbcfeg 可 以 获得 数据 库 配 置 参数 ,配合 -db <dbname> 选 项 使 用 可 以 获取 不 同 数据 
库 的 配置 参数 。 注 总， 使 用 该 命令 收集 数据 库 配 置 参数 时 需要 该 数据 库 处 于 活动 状态 。 
例如 : 

/home/db21inst1s$ db2pd -db sample -dbcfg 


Database Partition 0 -- Database SAMPLE -- Active -- Up 0 days 00:00:03 
Database Configuration Settings: 
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Description Memory Value Disk Value 

DB configuration release level 0xa00 0xa00 
Database release level Oxa00 0xa00 
Database territory US US 

Database code page 819 819 

Database code set LISO8859 1 ISO88359— 1 
Database country/reglion code 1 1 

Database collating sequence UNIQUE UNIQUE 
ALT COLLATE NON UNIQUE NON UNIOQUE 

DYN QUERY MGMT DISABLE DISABLE 


本 时 如 可 明显 


同样 ，Memory Value 为 当前 值 ，Disk Value 为 下 一 次 局 动 该 数据 库 时 生效 的 值 。 

例 3-14 ”监控 缓冲 池 信 息 。 

绥 宰 池 设 置 对 于 数据 库 的 性 能 影响 非常 大 .可 以 使 用 -bufferpools 选项 来 获取 数据 库 的 
缓冲 池 信 息 。 访 选项 同样 需要 配合 -db <dbname> 配 合 一 起 使 用 ， 例 如 : 


/home/db21inst1ls$ db2pd -db sample -bufferpools 

Database Partition 0 -—— Database SAMPLE -- Active —— Up 0 days 00:04:53 
BiiterPooGls: 

ES 二 ACtTIVeE POGL FD 1 

Max Bufferpool ID 1 

Max Bufferpool ID on Disk 1 

Num Bufferpools -= 

Address Id Name PageSz PA—NumPgs BA-NumPgs 

BlkSize ES NumTbsp PgsLeft CUrrentSz PostAlter SuspndTsct 
0x0780000020332F20 1 IRBMDEFAULTBP 4096 1000 0 ON60 1000 1000 0 
Ox071800000203320A0 4096 IBMSYSTEMBP4K 4096 160 0NUO0 16 16 0 
bxX0780000020332440 4097 IBMSYSTEMBP8K 8192 160 0NUO0 16 16 0 
Ox07800000203327E0 4098 IEBMSYSTEMBP16K 16384 160 ONO00 16 16 0 
Ox0780000020332B80 4099 IBMSYSTEMBP32K 32768 160 0ON00 16 16 0 


注意 : 

其 中 ,IBMSYSTEMBP4K、IBMSYSTEMBP8K.、IBMSYSTEMBP16K、IBMSYSTEMBP32K 
为 DB2 默认 创建 的 系统 缓冲 池 ， 在 之 前 这 四 个 缓冲 池 被 称 为 “隐藏 缓冲 池 ”。 如 果 在 
db2diag.log 中 看 到 使 用 这 些 缓冲 池 的 消息 ， 请 检查 缓冲 池 的 设置 是 否 合理 ， 是 否 设 置 得 超 
过 了 操作 系统 的 内 存 上 限 。 因 为 这 些 缓冲 池 都 非常 小 ， 如 果 使 用 到 这 些 缓冲 池 的 话 ， 性 能 
一 定 会 非常 差 。 
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例 3-15 ”监控 表 空 
可 以 使 用 -tablespaces i 


s 间 信息 。 
选项 获得 表 衬 


间 信 息 ， 


$ db2pd -ab sample -tablespaces 


同样 需要 配合 -db <dbname> 选 项 使 用 : 


Tablespace Autoresize Statistics: 

Address Id AS AR Initsize IncSize IIP MaxSize LastResize LRF 

Ox05261580 0 Yes Yes 33554432 一 No None None No 

Ox05261D50 1 Yes No 0 U NC 0 None NO 

Ox05726C0510 2 Yes Yes 33554432 一 No None None NO 

UXUDZoOCCEU 3 Yes Yes 33554432 一 No None None NO 

UXUDC 13EEU 4 Yes Yes 33554432 一 No None None NO 

Ox05C98360 5 Yes No 0 U NO 0 None NO 

在 命令 输出 的 Tablespace Autoresize Statistics 段 中 ，AS 字段 表明 表 衬 间 是 售 司 用 了 目 
动 存储 器 ，Yes 为 启用 ，No 为 未 启用 。AR 表示 Automatic Resize。 

例 3-16 监控 reorg 的 进度 。 

使 用 -reorg 选项 可 以 监控 表 reorg 的 进度 ， 如 下 所 丰 : 

db2 reorg table salesl 

db2pd -ap sample reorg 

Database Partition 0 -- Database SAMPLE -- Active -- Up 0 days 00:20:06 


Table Reorg Stats: 
Address TbspaceID TableID TableName Start End 


Ox0 1800000294CD438 3 259 SALES]1 2013-12- 


19 15:06:05-221603 n/a 


Phasestart MaxPhase Phase CurCount MaxCount Type Status Completion IndexID 


TempSspacelD 


2013=12— 19 1 0b:305 36065690 2 Balld 470 410 Offline Siarled 0 0 3 


3.5.2 ”使 用 db2pd 监控 死 锁 案例 


光合 经 1 册 
杂 的 问题 


会 存在 于 我 们 的 应 用 系统 中 ， 
。 除 了 抓 取 事 件 监视 器 , DB2 也 可 以 使 用 db2pd 命令 


县 ， 提 供 了 一 种 新 的 途径 来 诊断 死 锁 问 题 。 


我 们 可 以 使 用 db2pdcfg -catch 命令 来 捕获 铅 误 信 


集 出 错时 的 现场 信息 。 该 命令 的 使 用 语法 如 下 : 


Usage: 
-Catch 


Error Codes: 
<SqlCode>[,<reasonCode>| 


Giaar 


| 


Sets catchflag to catch error or warning. 


status 


| <errorCode> [<act1on>] 


县 ， 然 


如 何 捕获 死 锁 信 息 并 解决 死 
和 db2cos 脚本 来 获取 死 锁 信 


是 比较 复 


a Hi 
记 回 题 ， 


后 调用 sqllib/db2cos 脚本 来 收 


[count=<count>] 


/ sqlcode=<sqlCode>[,<reasonCode>| 
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RC (hex or integer) 

RC #¥define (such as SQLP LTIMEOUT) 
ADM (such as ADM1611) 

String (such as diagstr="Hello World™) 
ECF (hex or integer) 

"deadlock™ or "locktimeout" 


ACLt1ONs: 

[Stackl (tdefanlt)} Produce stack trace in db2diag.1log 

[db2cos] {default) Ran sqllib/db2cos callout script 

[stopdbz2trcl] Stop db2tre 

[dumpcomponent | Dump component flag 

[component=<component1ID>|] Component ID 

[lockname=<lockname>] Lockname for catching specific lock 
(lockname=000200030000001F0000000022) 

[locktype=<locktype>] Locktype for catching specific lock 


(locktype=R or locktype=22) 


下 面 我 们 通过 实例 来 讲解 如 何 使 用 db2pdcfg -catch 命令 获取 死 锁 信息 。 如 无 特殊 说 明 ， 
命令 均 使 用 DB2 实例 用 户 执 行 。 

(1) 将 SHOME/sqllib/cfg/db2cos 示例 脚本 复制 到 $HOME/sqllib 下 ， 并 改变 属性 ， 为 实 
例 用 户 添 加 执行 权限 : 

cp $HOME/sSql11ib/cfg/db2cos $HOME/sq1ll11ib 

chmod ut+x $HOME/sqllib/db2cos 

(2) 使 用 db2pdcfg -catch 捕获 死 锁 信息 ， 当 死 锁 出 现 的 时 候 调 用 db2cos 命令 。 可 以 使 
用 如 下 命令 之 一 : 

1])db2pdcfg ~catch deadlock 

bpdcto Cateh = SL > 


输出 如 下 : 

Error Catch #2 
Sqlcode: -911 
ReasonCode: 2 
RC: 0 
EP: 0 
Component ID: 0 
LockName: Not Set 
LockType: Not Set 


Current Count: 0 
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Max Count : es 

Bitmap: 0x661 

Actlion: Error Code catch flag enabled 

Act1ion: Execute sqllib/db2cos callout script 

Act1ion: Produce stack trace in db2diag.1log 
此 时 得 看 db2diag.log 的 输出 ， 可 以 看 到 类 似 信息 : 
2016-1L2-24-14.46.20.359000+480 I474200H346 LEVEL: Event 
PID I68 TID : 4480 PROC : db2syscs .exe 
INSTANCE: DB2 01 NODE : 000 
EDUID : 4480 EDUNAME: db2pdbe 0 
FUNCTION: DB2 UDB, RAS/PD component, pdErrorcCcatch, probe:30 
START : Error catch set for sqlCode -911 reasonCode 2 


eine 经 启动。 


$db2 +C 

2 CoOTmecL Lo soampile 

Database Connection Information 

Database server = DB2/AIX64 11.1.1.1 

SOE authorization ID = DB2TNSTI 

Local database allias = SAMPLE 

db2 => Create table tstdlock] {id int, name char (10)) 
DB20000I The SQL command completed successfully. 
db2 => commit 

DB20000I The SQL command completed successfully. 
db2 三 > lnsert 1Into tstdlockl values(l, test1") 
DB20000I The SQL command completed successfully. 


(4) 髓 新 开 一 个 命令 窗口 ， 我 们 称 之 为 窗口 2， 输 入 如 下 命令 : 


Sdh2 Te 

db2 => connect to sample 

Database Connection Information 

Database server = DB2/AIX64 11.1.1.1 

Sob authorization ID = DB21NSTL 

Local database alias = SAMPLE 

dB2 三 > create table tstdlock2 (aq int, name char (10})) 
DB20000I The SQL command completed successfully. 
db2 => commit 

DB20000I1 The SQL command completed successfully. 
db2 => insert into tstdlock2 values (2,'test2°") 
DB20000I The SQL command completed successfully. 
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db2 => select * from tstdlockl 

此 时 该 命令 会 挂 起 ， 处 于 锁 等 每 状态 ， 等 竺 窗口 1 中 的 insert 语句 提交 后 才能 继续 
进行 。 

(5) 切换 到 窗口 1， 输 入 如 下 命令 : 


dh2 => select * from tstdlock2z 


此 时 该 命令 也 会 挂 起 ， 处 于 锁 等 竺 状态， 等 竺 窗口 2 中 的 insert 语句 提交 后 才能 继续 
进行 。 

(6) 等 待 一 段 时 间 ， 取 决 于 数据 库 配 置 参 数 DLCHKTIME 的 设置 ， 默 认为 10 秒 就 会 
发 现 窗口 2 中 的 事务 因为 死 锁 而 回 深 : 


SOLO911N The current transaction has been rolled back because of a deadlock 
or timeout.: Reason code ™2",. SOQLSTATE=40001 


而 窗口 1 中 的 命令 执行 成 功 : 


dbh2 =» select * from tstdlock> 
LD NAME, 


U record(s) selected. 


注意 : 
在 实际 的 测试 中 ， 也 可 能 是 窗口 1 中 的 事务 回 滚 。 


此 时 查看 db2diag.log 文件 ， 会 看 到 如 下 信息 : 


2016— 12 24— L447.20.35930007480 T28093CA1L LEVEL: Ewent 

PID: 1 297606 TID : 1 PROC : db2agent (SAMPLE) 0 

INSTANCE: db2instl1 NODE : 000 DB : SAMPLE 

APPHDL: 0-8 APPID: *LOCAL .db21nst1.060330092553 

FUNCTION: DB2 UDB, trace services, pdInvokeCalloutscript, probe:10 
START: Invoking sqllib/db2cos script from global services sqlzeMapZrc 
2016—12-24—14.47.21.359000+480 JT28503C388 LEVEL: Event 

PID: 1397606 TID: = 1 PROGE =: dbz2zagent. (SAMPLE}Y 0 

INSTANCE: db2instl1 NODE : 000 DB : SAMPLE 

APPHDL: 0-8 APPID: *LOCAL .db21nst1.060330092553 

FUNCTION: DB2 UDB, trace services, pdInvokeCalloutscript, probe:20 
STOP: Completed invoking sqllib/db2cos script 


这 说 明 我 们 的 错误 捕获 机 制 已 经 成 功 捕获 到 和 死 锁 信息 ， 并且 调 用 了 db2cos 脚本 。 此 时 
查看 SHOME/sqllib/db2dump 目录 ， 会 看 到 db2cos.rpt 文件 。 注 意 ， 对 于 出 现 死 锁 的 情况 ， 
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我 们 的 错 放 捕获 机 制 会 两 次 调用 db2cos 脚本 ,第 一 次 吓 在 事务 回 深 前 ,第 二 侈 则 是 在 事务 
回 深 后 。 和 但 看 死 锁 的 信息 ， 我 们 应 该 关注 第 一 次 调用 db2cos 脚本 的 输出 。 


现在 我 们 看 一 下 db2cos 例子 脚本 的 内 容 ， 可 以 看 到 出 现 死 锁 时 我 们 的 处 理 机 制 : 


echo "Lock Deadlock Caught™ >> $HOME/s9gl11ib/db2dump/db2cos.rpt 
date >> S$HOME/s9gl1ib/db2dump/db2cos.rpt 

echo "Instance ™ $instance >> $HOME/sql1ib/db2dump/db2cos.rpt 
echo "Datbase: ™" S$database >> S$HOME/sqll1ib/db2dump/db2cos.rpt 


echo "Partition Number: ™ $dbpart >> S$HOME/sgl1ib/dbp2dump/db2cos.rpt 
echo "PID: ™ $pid >> $HOME/sqgqllib/db2dump/db2cos .rpt 

echo "TID: ™ $tid >> $HOME/sqgqllib/db2dump/db2cos .rpt 

echo "Function: ™ $function >> $HOME/sgllib/db2dump/db2cos.rpt 


echo "Component: ™ $component >> $HOME/s9gql11ib/db2dump/db2cos .rpt 
echo "vProbe: ™ S$probe >> S$HOME/sgqll1ib/db2dump/db2cos.rpt 

echo "Timestamp: "” $timestamp >> S$HOME/sqll1ib/db2dump/db2cos .rpt 
echo "APPID: ™ $appid >> S$HOME/sgql1lib/db2dump/db2cos.rpt 

echo "AppHdl: ™ $apphld >> $HOME/sqllib/db2dump/db2cos.rpt 

db2pd -db $database >> S$HOME/sqllib/db2dump/db2cos.rpt 


我 们 看 到 ， 如 末 捕 获 到 的 错误 是 死 锁 ， 我 们 将 执行 db2pd -db $database 命令 来 获取 数 


据 库 的 所 有 db2pd 输出 。 和 您 可 以 更 改 该 脚本 ， 从 而 仅 获 取 部 分 输出 ， 或 者 获取 其 他 信息 。 


我 们 查看 一 下 db2cosrpt 文件 ， 可 以 看 到 数据 库 中 存在 的 锁 信 息 : 


LOCKS : 
Address TranHdl Lockname ‘TYPBE Mode Sts Ouner Dur HaCnDL Alt Rlse 
OxXA402C0740 2 5314C4332453036C8324ABC41 Internal P ..S G210 0 0x40 


Ox402C0D08 3 3233214C43324533036C8324ABC41 Internal P ..S G310 0 0x40 
Ox402C06F0 2 00020012000000040000000052 Row ..XG210 8 Ox40 
OxX402C0808 3 00020012000000040000000052 Row .NS W* 3 10 0 0x0 
Dx402C09C0 2 000000010000000100012E0056 Internal VY ..35 G21 0 0 0x40 
Ox402cC0618 3 00000001000000010001LC400526 Jnternal VY ..SG310 0 0x40 
OxX402C1000 3 00020013000000040000000052 Row ..XG310 8 0x40 
OxXx402CO0ABO0 2 00020013000000040000000052 Row .NS W 3100 0xX0 
Ox402C0FBO 3 00020013000000000000000054 Table .IX G310 0 0x40 
OX402C0F38 2 000200130000000000000000534 Table .IS G210 0 0x0 
Ox402C0B/8 2 00020012000000000000000024 Table .I* G2 1 0 0 0X40 
Ox402C1028 3 00020012000000000000000054 Table .IS G310 0 0x0 


注意 状态 为 W* 的 锁 ， 这 个 锁 就 是 最 后 回 滚 的 那个 应 用 程序 的 锁 。 上 面 的 锁 信 息 为 ; 
Ox402C0808 3 00020012000000040000000052 ROW .NS W* 3 1 0 0 Ox0 


我 们 看 到 事务 句柄 TranHdl 为 3, 同时 我 们 看 到 持 有 这 个 锁 00020012000000040000000052 
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的 另 一 个 应 用 程序 的 句柄 为 2: 
OxA402C06F0 2 00020012000000040000000052 ROW ..X G2 1 0 8 Ox40 


使 用 db2pd -db sample transactions 奏 看 事务 信息 ， 我 们 可 以 看 到 应 用 程序 句柄 7 对 应 
事务 句柄 2， 应 用 程序 句柄 8 对 应 事务 句柄 3: 


Transactions: 

Address AppHandl [nod-index] TranHdl Locks State Tflag Tflag2 Firstlsn 
Lastlsn Logspace spaceReserved TID AxRegCnt GXID 

Ox4024D380 7 [000-00007] 2 6 WRITE Ox00000000 0x00000 000 Ox0000059D89F4 
OQx0000059D89F4 108 1/0 0xX000000000B08 1 0 

Ox4024E000 8 [000-00008] 3 6 WRITE Ox00000000 0x00000 000 Ox0000039DA3E0 
0xO0000059DA3E0 108 1/0 Ox000000000Bz2 1 0 


此 时 我 们 使 用 db2pd -db sample -appl 查看 应 用 程序 的 信息 ， 可 以 获得 C-AnchID 和 
C-StmtUID: 


Appllications: 

Address AppHandl [nod-index] NumAgents CoorPid Status C-AnchID C-StmtUID 
L-AnchID LIL-StmtUID Appid 

0x300E3DDO 8 [000-00008] 上 129 1606 UOW-Executing 196 1 131 1 
*LOCAL .db21nst1.060330092553 

Ox300E2B60 7 [000-00007] 1 1990 188 Lock-wait 46 1 46 1 
*TOCAL .db21nst1.060330092132 


同时 我 们 使 用 db2pd -db sample -dynamic 还 可 以 查看 动态 语句 的 输出 ， 可 以 根据 
C-AnchID 和 C-StmtUID 找到 当前 正在 执行 的 SQL 语句 : 


Dynamic SQL Statements : 

Address AnchID StmtUID NumEnyv NUmvVar NumRef NumExe Text 

Ox409D80C0 9 12 3 4 2 create table tstdlock2 (id int, name char (10)) 
OxA409E0AN0 46 1 1 1122 select * from tstdlockz 

Ox409DEDI/IO 9711111 SELECT COUNT(*) FROM SYSCAT PROCEDURES WHERE PROCNAME 二 
"SYSINSTALLROUTINES'" 


Dx409BD8BBQ T311233 10sert 1 EstdaLlock? vilaesi2. “test2") 
Ox409D3A10 132 1 2 1] create table tastdloakl id int, name char(10)) 
Ox409D3F60 150 1 1 1 1 1 insert into tstdlockl values{(l1, test1"') 
0xA409DEEFQ 196 1 1 1 3 3 select * from tstdlockl 

Ox409D31720 243 T0000 SET CURRENT LOCADE LC CTYPE = "Zh CN 


根据 AnchID 和 StmtUID， 我 们 可 以 看 到 执行 的 语句 为 : 


OXxA409E0AN10 46 1 1 122 select * from tstdlock2e 
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Ox409DFEFO 196 1 1 1 3 3 select * from tstdlockl 


一 旦 我 们 定位 引发 死 锁 的 语句 , 束 可 以 根据 业务 过 辑 对 该 SQL 语句 进行 调 优 和 创建 合 
理 的 索引 。 


3.5.3 db2pd 使 用 问题 总 结 


db2pd 是 一 于 功能 非常 强大 的 工具 ， 我 们 在 使 用 过 程 中 常见 的 有 以 下 儿 个 问题 : 
1) 因为 db2pd 一 直 在 增强 ， 所 以 在 多 个 DB2 版 本 之 间 在 一 些 命令 选项 上 有 微小 的 差 
。 和 弟弟 是 一 些 命令 选项 在 新 的 版 本 中 已 经 变化 或 者 添 加 了 新 的 选项 ， 硕 望 谈 者 使 用 时 多 
使 用 db2pd -h 合 看 帮助 。 

2) 因为 db2pd 工具 可 从 DB2 内 存 集 迅速 返回 即时 信息 ,所 以 该 工具 可 用 于 故障 诊断 。 
该 工具 不 寅 要 获得 任何 锁 存 右 或 使 用 任何 引擎 资源 就 可 以 收集 信息 。 因 此 ， 在 db2pd 收集 
信息 时 ， 有 可 能 (并 且 预 计 ) 会 检索 到 正在 更 改 的 信息 ; 这 样 的 话 ， 数 据 可 能 不 是 十 分 准确 。 
如 果 迪 到 正在 更 改 的 内 存 指针 ， 可 使 用 信号 处 理 程序 来 防止 db2pd 寞 第 终止 。 这 可 能 会 守 
致 输出 中 出 现 诸如 以 下 的 消息 :“ 正 在 更 改 的 数据 结构 已 强制 终止 命令 ”。 虽 然 如 此 ， 该 工 
具 对 于 故障 诊断 却 非常 有 用 。 在 不 加 锁 的 情况 下 收集 信息 有 两 个 好 处 : 检索 速度 更 快 并 且 
不 会 争 用 引擎 资源 。 

3) db2pd 除了 其 有 监控 功能 之 外 ， 还 可 以 用 于 故障 诊断 。 如 果 要 在 出 现 特 定 
SQLCODE、ZRC 代码 或 ECF 代码 时 捕获 关于 数据 库 管 理 系 统 的 信息 ， 那 么 可 以 使 用 
db2pdcfg -catch 命令 完成 此 操作 。 捕 获 到 错误 时 ， 将 启动 db2cos( 调 出 脚本 )。db2cos 文件 
可 以 目 行 改变 , 以 便 运行 解决 问题 所 需 的 任何 db2pd 命令 、 操作 系统 命令 或 任何 其 他 命令 。 
在 UNIX 和 Linux 上 , 模板 文件 db2cos 位 于 sqllib/bin 中 。 在 Windows 操作 系统 上 , db2cos 
位 于 SDB2PATH\bin 目录 中 。 

4) db2pd 命令 的 输出 通 弟 比较 多 ， 建 议 谈 者 把 输出 结果 管道 输出 到 文件 中 ， 使 用 编辑 
从来 全 看 。 

5) 对 于 经 党 使 用 的 db2pd 选项 ， 建 议 大 家 设置 db2pdopt 命令 选项 ， 这 样 可 以 在 使 用 
时 快速 调用 db2pdopt 设置 的 选项 。 下 和 面 我 们 举 一 个 实际 的 例子 : 假如 我 们 经 党 使 用 db2pd 
-db sample -locks -transactions -applications -dynamic 来 监控 相关 信息 ， 可 以 像 下 面 这 样 来 

在 UNIX/Linux 环境 中 ， 如 果 shell 是 ksh， 执 行 : 


(1) export DB2PDOPT="-qb sample -locks -transactions -applications ~dynamic" 
(2) db2pd 


在 Windows 环境 中 ， 执 行 : 
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(1) set DB2PDOPT=-qb sample -locks -transactions -applications ~dynamic 
(2)} db2pd 


执行 上 面 的 第 (2) 步 之 后 ，db2pd 命令 的 输出 结果 与 发 出 了 db2pd -db sample -locks 
-transactions -applications -dynamic 命令 的 相同 ， 也 就 是 说 DB2PDOPT 定义 了 db2pd 命令 
后 使 用 的 参数 选项 。 这 样 便于 快速 调用 db2pd 来 监控 我 们 需要 的 信息 。 


3.6 内存 监控 


3.6.1 db2pd 内 存 监控 
我 们 在 查看 数据 库 分 区 的 内 存 统计 信息 时 ， 可 以 通过 使 用 db2pd 的 选项 进行 查看 。 


-dbptnmem 
db2pd -dbptnmem 命令 显示 DB2 服务 器 当前 消耗 的 内 存量 , 并 在 较 高 级别 显示 使 用 这 
些 内 存 的 服务 器 区 域 。 


以 下 是 在 AIX 机 器 上 运行 db2pd -dbptnmem 的 输出 示例 : 
Database Partition Memory Controller Statistics 


Controller Automatic: YY 
Controller License Limit: N 


Controller Limit Enforced: N 


Memory Limit: 29564116KB 
CUrrent USade. J408640KB 
HWM usage: 1934080KB 

Cached memory: 1169216KB 


关于 这 些 数据 字段 和 列 的 描述 如 下 : 

e 控制 器 目 动 : 指示 内 存 控 制 嚣 设置。 如果 instance memory 配置 参数 设置 为 
automatic， 那 么 它 将 显示 值 “Y”。 这 意味 兰 数 据 库 管理 器 目 动 确定 内 存 耗 用 量 的 
上 限 。 

e 内 存 限 制 : 如 条 强 制 施加 了 实例 内 存 限 制 ， 那 么 Instance memory 配置 参数 的 值 是 
可 以 耗 用 的 DB2 服务 器 内 存 的 上 限 。 

e 当前 使 用 量 : 服务 器 当前 耗 用 的 内 存量 。 

e HWM 使 用 量 : 目 激 活 数 据 库 分 区 (在 db2start 命令 运行 时 ) 以 来 消耗 的 内 存 局 水 
位 标记 (HWM) 或 峰值 。 
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e 局 速 级 存 的 内 存 : 当前 使 用 量 中 未 使 用 但 为 了 所 局 将 来 内 存 请 求 的 性 能 而 届 速 绥 
存 的 内 存量 。 


Individual Memory Consumers: 


Name Mem Used (KB) HWM Used (KB) Cached (KB) 
APPL—PMBSDB 160000 160000 153280 
DBMS—db2pmbs JI9424 59424 15168 
FMP RESOURCES 22528 22528 0 
PRIVATE 80128 106944 1i1412 
DB—PMBSDB 59090560 161 7171024 983296 


上 和 面 列 示 了 DB2 服务 器 中 有 所 有 已 注册 的 内 存 “ 使 用 者 ”以 及 它们 消耗 的 内 存 总 量 。 列 
摘 述 如 下 : 
e 名称 : 内存“ 使 用 者 ”的 简短 专 有 名 称 ， 例 如 APPL-dbname 为 数据 库 dbname 耗 
用 的 应 用 程序 内 存 。 


e DBMS-name: 全 局 数据 库 管 理 器 内 存 需 求 。 

e FMP RESOURCES: 与 db2fimps 进行 通信 所 需 的 内 存 。 

e PRIVATE: 其 他 专用 内 存 需 求 。 

e FCM RESOURCES: 快速 通信 管理 器 资源 。 

e LCL-pid: 用 于 与 本 地 应 用 程序 进行 通信 的 内 存 段 。 

es DB-dbname: 为 数据 库 dbname 耗 用 的 数据 库 内 存 。 

e 使 用 的 内 存 (KB): 当前 分 配给 使 用 者 的 内 存量 。 

e 使 用 的 HWM(KB): 使 用 者 曾 耗 用 的 内 存量 的 局 水 位 标记 (HWM)， 即 内 存量 峰值 。 

e 已 高 速 缓存 (KB): 在 “使 用 的 内 存 ” 中 ， 当 前 未 使 用 但 立即 可 用 于 将 来 的 内 存 分 

-memblock 

在 尝试 了 解 内 存 使 用 情况 时 ，db2pd -memblock 命令 非常 有 用 ， 如 下 所 示 : 
DBMS 集中 的 所 有 内 存 块 : 
地 址 池 标 识 池 名 称 块 存活 时 间 大 小 ( 字 节 ) I 工 LOC 文件 
0x0780000000740068 62 resynch 2 > 1 1746 1583816485 
0x0780000000725688 62 resynch 了 108864 1 27 1599127346 
Ox07800000001F4348 57 ostrack 6 Jo0048 ] 3047 698130716 
0x07800000001B5608 57 ostrack 5 240048 1 3034 698130716 
Ox07800000001A0068 57 ostrack 本 80 1 2970 698130716 
Ox07800000001A00E8 57 ostrack 2 240 1 2983 698130716 
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XU 1800000001A0208 
0x07800000001A0288 
0x0780000000700068 
Ox07800000007001E8 
UXU /800000007100248 


J1 OstLrack 
31 加 号 七 天 己 尼 长 
10 apmh 
10 apmh 
10 apmh 


接 下 来 是 已 排序 的 “性 能 池 ” 输 出 
按 ostrack 池 大 小 排序 的 内 存 块 : 


池 标 识 池 名 称 ”总 大 小 ( 字 证 ) 
了 ostrack JD160048 
二 | Ostrack 240048 
本 这 ostrack 240 

中 Ostrack 80 

“| Ostrack 80 

“| ostrack 80 
ostrack 池 的 总 大 小 : 5400576 了 字 他 
按 apmh 池 大 小 排序 的 内 存 块 : 

池 标 识 池 名 称 ”总 大 小 ( 字 节 ) 
10 apmh 40200 
10 apmh TON016 
10 apmh 6096 

10 apmh 2516 

10 apmh 496 

10 apmh 360 

10 apmh 176 

0 apmh 32 

10 apmh 48 

了 apmh 本 二 

apmh 池 的 总 大 小 : 60092 字 节 


最 后 一 部 分 输出 是 对 整个 DBMS 集 的 内 存 使 用 者 进行 排序 


DBMS 内 存 集 中 的 所 有 内 存 使 用 者 : 


池 标 识 
57 
50 
50 
5 了 
50 
62 
72 
69 
50 
70 


池 名 称 


ostrack 
sqlch 
solch 
ostrack 
saqlch 
resynch 
eduanh 
krcbh 
solch 
apmh 


总 大 小 ( 字 节 ) 字 节 $ 总 计数 


总 计数 


PM 


3160048 71.90 
1 站 二 9 


118496 
211184 
240048 
1]144464 
108864 
108048 
13640 
43122 
40200 


> 
.34 
| 
es 
sd 
= 
| 
> 


一 


1 
1 
1 
1 
时 
3 
1 
之 


人 
an 
于 


文件 


2999 
3009 
1024 
914 

1000 


e698130 41 
e698130 11 


698130171 
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6 
6 
698130716 
6 
6 


esBl301l 
e981301716 


e98130716 
69813017116 
387188 71939032 
1937674139 
1937614139 


BE mm 


本 

298062990230 
1586829889 
13124713490 
1586829889 
1953793439 
38188 19032 
1903193439 
1583816482 
1931614139 
193/1614139 


计数 多 


LOC 


Tf 


3047 698130716 


202 
260 
3034 
1 
121 
1 /4 
34 
214 
121 


23164613953 
2216461525 
69813071e6 
2216461525 
1539912 1346 
A4210081292 
4210081392 
27646 1 
29886298236 


探 


= 
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69 krcbh 号 0.46 1] 本 地 838 698130716 
50 saqlch 31000 0 .43 31 Pa 633 39662245031 
50 sqlen 29456 让 交 31 2 930 3966224531 
ee kerh 15316 Ba 1] 入 151 T1193352163 
50 salch 14697 避 .之 1 RE 345 A2910d67555 
在 UNIX 和 Linux 环境 中 ， 还 可 以 报告 私有 内 存 的 内 存 块 。 例 如 : 

db2pd -memb pid=159770 

专用 内 存 集 中 的 所 有 内 存 块 : 

地 址 池 标 识 池 名 称 块 存活 时 间 大 小 ( 字 节 ) I LOC ”文件 
OxO000000011]0469068 88 private 1 2488 Se 42839930508 
OxO0000000]110469A48 88 private 2 1608 下 4203993058 
0xO000000011046A0A8 88 private 对 4929 LW 42839930508 
Ox000000011046B408 88 private 4 7336 外 本 /2 42839930258 
UXUUUUUUU1L1L0O46DOC8 88 private 3 32 LL 4283993008 
OxO000000011046D108 88 private 6 6128 小 小子 芝 23993038 
OxO000000011046EB68 88 private 1 168 0 47283993038 
0x000000011046EC28 88 private 8 24 1 Ty 42839930208 
OQ0x000000011046EC68 88 private 9 408 1] 112 4283993058 
OxO000000011046EE28 88 private 10 10 Fz 二 村 之 4283993008 
OxO000000011046F288 88 private 1 3464 | We I 4283993008 
0x00000001104/710028 88 private 是 受 0 由 42839930589 
OxO00000001104700A8 88 private 3 480 1 1534 B62348285 
0xO00000001104/102A8 88 private 1 4 480 ] 1939 862348285 
OxO0000000110499FA8 88 private 80 6550] | We ed a 
内 存 集 总 大 小 : 94847 字 节 

按 大 小 排序 的 内 存 块 : 

池 标 识 池 名 称 ” 总 大 小 ( 字 节 ) 总 计数 LOC 文件 

88 private 65551 于 | 4231 192244 

88 private 20336 ja 1 /2 4283993028 

88 private 480 1 1939 86234828D5 

88 private 480 | 1 534 86234828D5 


内 存 集 总 大 小 : 94847 字 节 
-bufferpool 


通过 db2pd _d dbname _buferpool 选项 可 以 查看 数据 库 当前 的 缓冲 池 大 小 以 及 当前 的 
使 用 情况 ， 如 图 3-20 所 示 。 
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BUTTRerpoa1s : 

First Active Pool ID 和 1 

Max Bufferpool ID 

Max Bufferpool ID on Disk 1 

Num Bufferpools 5 
Name | - BA-NuMmPgSs Blksize NumTbsp PgsToRemow Currentsz PpostAlter suspndTsct Automatic 
IEMDEFAULTBP [38 | 0D 0D 13 0 0057 057 器 TT Ue 


Dx07 D0000LIA0IUEAG0 4099 IEMSYSTEMBP32K 


switch is 


BPID DatLRds DatPRds HitRatio [rmpDatLRds TmpDatPRds HitRatio i i mpIdxLRds TmpIdxPRds HitRatic 
006 LDD Do 1 722304496 0 100. 00% | 41730790 | nO. O00Y 0 0 00. 00% 

QO. O00% 

D0 .00% 

UO. 00% 

QO .00% 


图 3-20 ”使 用 -buferpool 选项 


通过 pageSz * PA-NumPgs / 1024 = 16KB 内 存 页 * 66057 / 1024 = 1032 MB， 计 算得 出 
当前 数据 库 中 IBMDEFAULTBP 这 个 缓冲 池 的 大 小 为 1032MB。 
还 可 以 通过 这 个 命令 Ii ee 爱 冲 池 的 数据 和 索引 缓冲 命中 率 。 
关于 内 存 集 (memset)、 内 存 池 (mempoo]l) 和 内 存 块 (memblock) 的 详细 讲解 ， 请 读者 参见 
《高 级 进 阶 DB2( 第 3 版 )》 一 书 。 


3.6.2 db2mtrk 内 存 上 监控 


db2mtrk 是 用 于 在 DB2 数据 库 中 进行 内 存 跟踪 的 工具 ， 可 以 用 于 查看 实例 、 数 据 库 、 


代理 进程 当前 对 内 存 的 使 用 状态 。 
例 3-17 db2mtrk 示例 1。 


B20ETE TT dd YY 

Memory for database: SAMPLE 

Backup/Restore/Util Heap 1s of size 16384 bytes 
Package Cache 1s of size 81920 pytes 

Catalog Cache Heap 1s of size 65536 bytes 

Buffer Pool Heap 1s of size 4341760 bytes 

Buffer Pool Heap 1s of size 655360 bytes 

Buffer Pool Heap 15 of size 393216 bytes 

Buffer Pool Heap 1s of size 262144 bytes 

Buffer Pool Heap ls of size 196608 bytes 

Lock Manager Heap 1s of size 491520 bytes 
Database Heap 15 of size 3637248 bytes 

Other Memory 1s of size 16384 bytes 

Application Control Heap 1s of size 327680 DYtes 
Application Group Shared Heap 1s of size 57344000 bytes 
Total: 6/829160 bytes 
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例 3-18 db2mtrk 示例 2。 


sdb2mtrk -i -d -p -r 1200 
Tracking Memory on: 2012/10/10 at 17:05:24 
Memory for instance 


other fcmbp monh 
28.4M 832.0K 6 .8M 
Memory for datlLabase: POM 
utilih pckcacheh other catcacheh bph (1) bpoh {S32K) 
J106.0K 118.1M 192=0K b .3M 18.4G B832. 0K 
bph (S16K) bph (SS8K) bph (SsS4K) shsorth lockh dbh 
IJ16.0K 448 .0K 384.0K 338.2M Ts3 10 .4M 
apph (2718/10)apph (2/71866)apph (2 1864)apph (27189)apph (271/88})apph (27187) 
64.0K 64 .0K 128.0K 64.0K 64.0K 64 .UK 
apph (2//86)apph (217i185)apph (21184)apph (27183)apph (27/82})apph (27181]1) 
64.0K 64 .0K 64.0K 64.0K 64 .UK 64.0K 
apph (3/10) apph 4369) apph (368) appshrh 
64.0K 64.0K 64 .0K 21.0M 
Memory for agent 23318 
other 
192 -0 
Memory for agent 8208 / 
other 
192 OF 


db2mtrk 工具 的 语法 如 下 : 
e Usage: db2mtrk -1|-d|-al|-p[-m|-w||[-v| |[-r nterval [count|| [-hldb2mtrk -1 # 壮 
示 当 前 实例 的 内 存 使 用 情况 
db2mtrk -i -V # 显 示 当 前 实例 的 内 存 使 用 情况 的 详细 信息 
db2mtrk -4 ”# 显 示 数 据 库 的 内 存 使 用 情况 
db2mtrk -d -v # 显 示 数 据 库 的 内 存 使 用 情况 的 详细 信息 
db2mtrk -p  ## 显 示人 代理 进程 专用 内 存 使 用 率 
db2mtrk -h ”# 显 示 帮 助 信息 
-m 参数 选项 用 于 显示 最 大 的 内 存 使 用 上 线 
-W 参数 选项 用 于 显示 使 用 过 程 中 内 存 达 到 的 最 大 值 
- 工 参数 选项 用 于 重复 显示 ， 其 中 ，interval 是 重复 显示 的 时 间 间 隔 数 ，count 是 要 重复 
显示 的 次 数 
interval 指定 以 秒 为 单位 的 重复 间 隅 
count 指定 间 隅 的 次 数 


watermark 
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-Vv 许 细 输出 
-h 显示 帮助 信息 
例 3-18 显示 了 实例 级 别 和 数据 库 级 别 内 存 使 用 情况 的 详细 信息 。 
在 DB2V9.1 中 对 该 命令 的 -4 选项 和 -1 选项 做 了 以 下 更 改 : 
e 在 Windows 平台 上 ， 现 在 文 持 用 于 显示 数据 库 级 别 内 存 的 -d 选项 。 
e 由 于 现在 可 通过 -d 选项 来 显示 数据 库 级 别 内 存 ， 因 此 -i 选项 仅 用 于 显示 实例 级 
别 内 存 。 
在 db2mtrk 工具 的 输出 信息 中 有 下 和 面 几 种 类 型 的 信息 : 
e 当前 值 的 大 小 
最 大 值 的 限制 (hard limit) 
最 高 值 (high water mark) 
类 型 (用 于 指定 使 用 了 哪 种 内 存 ) 
代理 进程 使 用 的 内 容 ( 只 针对 私有 内 存 池 ) 
提示 : 
在 我 们 使 用 db2mtrk 工具 时 ， 主 要 查看 高 水 位 和 实际 的 配置 之 间 是 否 接近 。 例 如 ， 如 
果 util heap sz 的 高 水 位 逼近 了 实际 的 数据 库 配 置 参 数 指定 的 值 ， 那 说 明 您 可 以 考虑 增加 
该 参数 。 当 然 ， 有 的 时 候 我 们 还 可 能 看 到 高 水 平 的 值 超过 了 实际 配置 的 值 ， 这 主要 是 因为 
DB2 部 分 由 数据 库 配 置 参 数 设 置 的 值 只 是 软 限制 而 不 是 硬 限 制 。 


3.7 ”本章 小 结 


本 章 我 们 给 大 家 详细 讲解 了 一 些 监控 案例 ， 希 望 大 家 能 够 从 这 些 案例 中 得 到 一 些 启 
发 。 其 实 本 章 所 讲 的 大 部 分 案例 都 是 实际 生产 中 经 常 碰 到 的 案例 ， 

在 实际 的 生产 环境 下 ， 在 怀疑 数据 库 中 可 能 存在 着 性 能 问题 的 时 候 ， 就 可 以 选择 合适 
的 临 控 工具 和 手段 来 发 现 数据 库 中 可 能 存在 的 瓶颈 或 不 合理 的 资源 使 用 。 在 实际 发 生性 能 
问题 的 时 候 ， 问 题 的 产生 原因 可 能 并 不 单一 ， 而 是 由 很 复杂 的 原因 造成 的 ， 所 以 往往 需要 
通过 多 方面 的 监控 分 析 才 能 得 到 准确 的 结论 。 所 以 本 章 介绍 的 这 些 工具 经 常 需要 以 多 种 方 
式 结合 起 来 使 用 ， 然 后 将 监控 结果 综合 地 进行 分 析 ， 从 而 才能 得 到 最 准确 的 分 析 结论 ， 
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在 DB2 数据 库 中 ， 有 实例 级 参数 (dbm cfg)、 数 据 库 级 参数 (db cfg) 和 DB2 注册 变量 
(db2set -四 三 种 配置 参数 。DB2 利用 这 三 种 配置 参数 来 进行 数据 库 约束 和 资源 限制 。 

DB2 配置 参数 对 数据 库 来 说 非常 重要 ， 通 过 对 这 些 参数 合理 地 进行 调整 ， 可 以 极 大 地 
提高 数据 库 性 能 。 这 三 种 配置 参数 里 面 有 几 百 个 具体 参数 ， 本 章 只 讲解 那些 对 数据 库 性 能 
影响 最 大 的 参数 。 

本 章 主 要 讲解 如 下 内 容 : 

e 补 识 DB2 配置 参数 
监控 和 调 优 实例 级 参数 
监控 和 调 优 数 据 库 级 参数 
调整 DB2 注册 变量 
内 存 上 自动 调整 


4.1 初 识 DB2 配置 参数 


实例 级 参数 、 数 据 库 级 参数 和 DB2 注册 变量 


DB2 有 几 百 个 配置 参数 。 其 中 很 多 参数 都 是 由 DB2 目 动 配置 的 ， 而 其 他 一 些 参数 则 
都 有 各 目的 默认 值 ， 这 些 默认 值 都 被 证 明 在 大 多 数 环 境 中 能 够 发 挥 得 很 好 。 接 下 来 ， 我 们 
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只 摘 述 那些 间 间 需要 另外 进行 配置 的 参数 。 

实例 级 参数 相当 于 全 局 变量 ， 作 用 于 这 个 实例 下 的 所 有 数据 库 ， 有 些 实例 级 (数据 库 管 
理 器 ) 参 数 可 以 在 线 更 改 ( 立 即 生 效 )， 而 另 一 些 参数 则 要 重启 实例 后 才能 生效 ( 即 db2stop 之 
后 接 看 db2start)。 数 据 库 级 参数 类 似 于 局 部 变量 ， 只 作用 于 当前 数据 库 ， 有 些 数据 库 级 参 
数 的 更 改 可 以 立即 生效 ， 而 另 一 些 则 要 求 先 俘 止 数据 库 ， 册 重新 激活 数据 库 。 每 种 配置 参 
数 的 文档 中 都 规定 了 参数 是 否 可 以 在 线 配置 。DB2 注册 变量 也 分 作用 域 ， 比 如 全 局 级 、 实 
例 级 等 等 。 

实例 级 参数 、 数 据 库 级 参数 和 DB2 注册 变量 的 基本 管理 命令 如 表 4-1 所 示 。 


表 4-1 实例 级 、 数 据 库 级 参数 和 DB2 注册 变量 的 基本 管理 命令 


命令 朱 ” 述 
get dbm cfg <show detail> 显示 实例 级 参数 < 详细 显示 > 
update dbm cig using param name param Value 修改 实例 级 参数 
get db cfg for db name <show detall> 显示 指定 的 数据 库 级 参数 < 评 细 显示 > 
er 修改 数据 库 级 参数 
db2set -lr 显示 DB2 中 已 经 设置 的 所 有 注册 变量 
db2set param name=param Value 设置 DB2 注册 变量 


当 您 修改 了 实例 级 参数 后 ,就 可 以 用 下 和 面 的 DB2 CLP 命令 来 得 看 该 设置 是 否 立 即 生效 
(在 线 ): 


db2 attach to db27nst]1 
db2 get dbm cfg show detail 


如 果 修 改 了 数据 库 级 参数 ， 可 以 用 如 下 命令 进行 合 看 : 
db2 get db cfqg for dbname Show detall 


例如 ， 在 接 下 来 的 情况 中 ，max querydegree 和 JAVA HEAP SZ 分 别 增 加 到 了 3 和 
3096。 如 果 参 数 是 在 线 配 置 的 ， 那么 Delayed Value 和 Current Value 应 该 是 一 样 的 。 和 否则 ， 
实例 级 参数 就 需要 重新 启动 实例 ， 数 据 库 级 参数 束 要 重新 激活 数据 库 

例 4-1 Show Details 实例 。 


sdb2 get dbm cfg show detalil 
Database Manager Configuration 
Node type = Enterprise Server Edition with local and remote clients 
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Description Parameter Current Value Delayed Value 
Maximum gquery degree of parallelism (max querydegree) = 3 3 
Java Virtual Machine heap size (4KB) (JAVA HEAP S2) = 2048 3096 


在 上 面 的 例子 中 ，JAVA_HEAP SZ 修改 之 后 的 值 并 未 生效 ， 这 就 需要 重 局 实例 ， 而 
Imax querydegree 修改 之 后 的 值 已 经 生效 了 了 。 


4.2 ”监控 和 调 优 实例 级 (DBM) 配 置 参 数 


在 以 下 要 讲 的 配置 参数 中 ， 有 些 是 从 共 至 内 存 中 分 配 罕 间 的 ， 所 以 应 该 记 住 操 作 系 统 
内 存 的 限制 ， 您 必须 确保 没有 过 度 分 配 内 存 。 如 果 过 度 分 配 内 存 ， 将 会 导致 操作 系统 的 内 
存 不 足 而 发 生 换 页 (paging)， 这 对 于 性 能 来 说 后 果 将 是 灾难 性 的 。 


4.2.1 代理 程序 相关 配置 参数 


e max coordagents 参数 表明 用 来 接收 应 用 程序 请 来 的 代理 程序 的 最 大 数目 。 
max coordagents 的 值 应 当 全 少 是 实例 下 所 有 数据 库 中 maxappls( 蛙 一 数据 库 允 许 
的 并 发 应 用 程 夺 最 大 数目 ) 值 的 总 和 。 如 果 数 据 库 的 数量 大 于 numdb 参数 ， 那 么 最 
安全 的 方案 就 是 使 用 numdb 和 maxappls 最 大 值 的 乘积 。 每 个 额外 的 代理 程序 都 需 
要 一 些 资源 开销 ， 这 些 开 销 在 司 动 数 据 库 管理 器 时 会 分 配给 代理 程序 。 在 内 存 受 
限 (Cmemory constrained) 的 环境 中 , 这 个 参数 对 于 限制 数据 库 管 理 需 的 总 内 存 使 用 量 
很 有 用 ， 因 为 每 个 附加 的 代理 都 需要 额外 的 内 存 。 

e num poolagents 参数 指定 您 希望 代理 程序 池 里 保存 多 少 代理 程序 .如 果 创 建 的 代理 
程序 多 于 该 参数 住所 指明 的 数目 ， 那 么 代理 程序 执行 客 目 己 当 前 的 请 求 后 将 被 销 
毁 而 不 是 返回 给 代理 程序 池 。 如 采访 参数 的 值 为 0， 将 不 保存 任何 代理 程序 ， 在 需 
要 的 时 候 才 创建 ， 在 代理 程序 执行 完 目 己 当前 的 请 求 后 束 销 毁 。 要 避免 因 在 并 发 
连接 许多 应 用 程序 的 OLTP 环境 中 频 堪 创建 和 销毁 代理 程序 而 产生 的 成 本 ， 请 将 
num poolagents 的 值 增加 到 接近 max coordagents 的 值 。 

e num initagents 参数 决定 代理 程序 的 初始 数量 ， 这 些 代 理 程 序 是 在 db2start 时 在 代 
理 程 序 池 中 创建 的 。 指 定 的 初始 代理 程序 数目 要 合适 (尽管 并 非 必要 条 件 )， 这 可 以 
缩短 “ 热 吴 ”时 间 。num initagents 指定 在 db2start 时 的 代理 池 中 创建 的 空闲 代理 
的 数量 ， 可 以 帮助 加 快 在 开始 使 用 数据 库 时 的 连接 。 
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1. 如 何 更 改 参数 
为 了 更 改 这 些 参 数 ， 请 运行 以 下 命令 : 


db2 -YY update dbm cfg using max Coordagents a Value 
db2 -vv update dbm cfg using num poolagents b value 
db2 -V update dbm cfg using num initagents C value 


db2 -Vv terminate 

2. 调 优 步 又 

在 运行 期 间 的 任何 时 候 ， 您 都 可 以 使 用 下 面 这 个 命令 来 获取 实例 的 快照 数据 : 
db2 -vv get snapshot for dbm 

看 一 下 下 列 输 出 行 : 


High water mark for agents registered = 4 


High water mark for agents waiting for a token = 0 
Agents reglistered = 4 

Agents waiting for a token = 0 

Idle agents = 0 

Agents assigned from pool = 5 

Agents created from empty pool = 4 

Agents stolen from another application = 0 

High water mark for coordinating agents = 4 

Max agents overflow = 0 


“Idle agents” 显 示 了 在 代理 池 中 空闲 代理 的 数量 ， 而 “Agents assigned from pool” 则 
显示 了 从 代理 池 中 将 代理 分 配 出 去 的 次 数 。“Asgents created from empty pool” 显 示 了 在 衬 
池 情 况 下 必须 创建 的 代理 的 数量 ， 包 括 num initagents。 如 果 “Agents created from empty 
pool”/“Agents assigned from pool” 的 比例 较 高 ($:1 或 更 大 )， 那 么 可 能 表明 应 该 增加 
num poolagents 。 这 还 可 能 表明 系统 的 总 体 工作 负载 太 高 。 此 时 可 以 通过 降低 
max coordagents 来 调整 工作 负载 。 如 果 这 个 比例 较 低 ,那么 暗示 看 num poolagents 可 能 被 
设 得 太 癌 , 有 些 代理 束 会 浪费 系统 资源 。 如 果 您 发 现 “Agents waiting for atoken ”或 “Agents 
stolen from another application ”不 等 于 0， 那 么 可 能 需要 增加 max coordagents 以 允许 数据 
库 管 理 器 可 以 使 用 更 多 的 代理 程序 。 

如 果 “Agents stolen from another application” 大 于 0， 并 且 机 喜 的 内 存 资源 是 充足 的 ， 
那么 可 以 增加 max coordagents。 此 外 ，“Local connections” 二 “Remote connections to db 
manager” 将 指出 连接 到 实例 的 并 发 连接 的 数量 。“High water mark for agents registered” 
将 报告 在 某 一 次 连接 到 数据 库 管 理 器 的 代理 曾 出 现 的 最 大 数量 。“Max agents overflow” 


第 4 章 DB2 配置 参数 调整 


报告 当 已 经 达到 max coordagents 时 ， 收 到 的 创建 新 代理 的 请 求 的 次 数 。 最 后 ，“Agents 
Registered” 显 示 在 被 监控 的 数据 库 定 理 占 实例 中 当前 注册 的 代理 的 数量 。 


3. 调 优 建议 


在 大 多 数 情 况 下 ， 将 max coordagents 和 num poolagents 的 值 设 置 成 略微 大 于 并 发 应 
用 程序 连接 的 最 大 预计 数 日 。 让 num initagents 保留 为 默认 值 会 比较 好 。 

num initagents 和 num poolagents 应 该 设置 为 预期 的 并 发 实例 级 连接 的 平均 数量 ， 对 
于 OLAP 这 个 值 通常 比较 低 ,， 而 对 于 OLTP 就 要 局 一 些 。 对 于 存在 大 量 ramp up 连接 情况 
下 的 性 能 基准 ， 将 num initagents 设置 成 预期 的 连接 数量 (这 将 减少 资源 争 用 ， 从 而 显 车 
地 减少 ramp up 连接 所 需 的 时 间 )。 在 使 用 了 连接 池 的 3 层 环境 中 ，num initagents 和 
num poolagents 对 性 能 的 影响 很 小 ， 因 为 即使 在 应 用 程序 空闲 的 时 候 ， 应 用 服务 器 也 会 连 
续 不 断 地 维护 连接 。 

DB2 的 这 两 个 参数 max connections 和 max coordagents 都 可 以 被 设置 成 automatic。 
如 条 您 认为 系统 可 以 承受 所 有 的 连接 ， 同 时 又 想 限制 被 协调 代理 消耗 的 资产， 那么 可 以 只 
将 max connections 设 定 为 automatic， 而 将 max coordagents 设 定 为 数值 。 这 样 系统 会 认 
为 可 以 连 到 实例 的 连接 数 是 无 限 的 。 如 果 您 对 最 大 连接 数 和 协调 代理 数 都 不 想 进行 限制 的 
话 ， 可 以 将 它们 都 议定 为 automatic。 


4.2.2 sheapthres 


排序 堆 阀 值 (sheapthres) 是 对 专用 排序 在 任何 给 定时 间 可 以 使 用 的 总 内 存量 的 实例 范 
软 限 制 。 当 某 个 实例 使 用 的 专用 排序 内 存 总 量 达到 此 限制 时 ， 为 其 他 传 入 专用 排序 请 求 分 
配 的 内 存 将 显著 减少 。sheapthres 参数 在 DB2 V9.5 及 以 后 的 版 本 中 不 再 适用 ， 因 为 绝 大 多 
数 的 排序 都 成 为 共享 内 存 的 排序 ， 所 以 建议 此 值 为 0。 仪 当 sheapthres 设置 为 0 时 , 才 人 允许 
目 动 调整 sheapthres shr 或 sortheap。 

排序 堆 阀 值 (sheapthres) 和 共享 排序 的 排序 堆 阀 值 (sheapthres_shr) 能 控制 可 用 于 整个 实 
例 中 所 有 排序 的 内 存 总 量 。 在 4.3.4 贡 中 ， 我 们 将 更 加 详细 地 描述 影 啊 排序 性 能 的 参数 。 


4.2.3 fcm num buffers 


fcm num buffers 只 在 有 多 个 馆 辑 分 区 的 DPF 环境 中 使 用 ， 指 定 用 于 内 部 通信 的 大 小 
为 4 KB 的 缓冲 区 的 数量 。 如 果 没 有 使 用 DPF， 那 么 这 个 值 甚至 不 会 出 现在 快照 输出 中 。 


此 外 ， 该 信息 将 来 目 其 上 运行 了 快照 的 分 区 。 
Node FCM information corresponds to = 2 
Free FCM buffers -Ll 
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Total FCM butfters = 10740 
Free FCM buffers low water mark = 10660 
Maximum number of FCM buffers = 2097880 
Free FCM channels = 6224 
Total ECM channels = 6203 
Free FCM channels low water mark = 6066 
Maximum number of FCM channels = 20971880 
Number of FCM nodes 三 


例如 ， 在 DBM 快照 之 前 的 那个 快照 中 ，“Node FCM information corresponds to” 
显示 了 值 2， 因 此 和 它 是 从 2 号 分 区 那里 得 来 的 。“Get snapshot for dbm global” 可 用 于 获得 
所 有 分 区 值 的 群集 。 

DBM 快照 的 FCM Node 部 分 可 用 于 查看 主要 的 分 区 间 通 信 发 生 的 地 点 ， 进 而 用 于 调 
全 。 如 果 通 信和 量 很 大 ， 就 表明 需要 更 多 的 FCM 缓冲 区 内 存 ， 笛 要 不 同 的 分 区 键 ， 或 者 需 
要 不 同 的 表 来 分 派 表 空间 。 如果 “Free FCM buffers low water mark” 小 十 fcm num buffers 
的 15%, 那么 可 以 增加 fcm num buffers 的 大 小 , 直到 “Free FCM buffers low water mark” 
大 于 或 等 于 fem num buffers 的 13%， 以 确保 总 有 足够 的 FCM 资源 可 供 使 用 。 


4.2.4 sheapthres shr 


这 是 对 实例 中 并 发 共享 的 排序 可 以 消耗 的 内 存 总 量 的 硬 忻 限制 。 当 sheapthres 大 于 0 
时 ，sheapthres shr 这 个 值 只 有 在 以 下 情况 下 才 适 用 : intra parallel=yes， 这 是 因为 当 
intra parallel 设置 为 no 时 ， 没 有 任何 共享 排序 ;或 者 Concentrator 在 (max connections > 
max coordagents) 范 围 内 。 对 于 在 with hold 选项 下 使 用 游标 的 排序 ， 将 从 共享 内 存 中 为 
分 配 内 存 。 

“Shared Sort heap high water mark” 显示 最 多 一 次 分 配 了 的 共享 排序 内 存 。 如 果 这 

个 值 总 是 远 远 低 于 sheapthres shr， 那 么 应 该 减少 sheapthres shr， 以 便 为 其 他 数据 库 组 件 
节省 内 存 。 如 果 这 个 值 刚 好 接近 于 sheapthres shr, 那么 可 能 需要 增加 sheapthres shr。“Total 
Shared Sort heap allocated” 是 从 排序 推 空间 中 为 所 有 排序 分 配 的 总 页 数 。 如 条 元 系 什 大 
于 或 等 于 sheapthres_shr, 那么 意味 看 这 些 排序 没有 得 到 由 sortheap 参数 定义 的 完整 排序 堆 
空间 。 增 加 sheapthres_shr 的 大 小 以 帮助 避免 这 种 情况 发 生 。 

在 设置 时 ， 应 尽量 使 其 为 sortheap 的 倍数 。 


4.2.5 Intra parallel 


该 参数 指定 数据 库 管 理 亏 是 售 可 以 使 用 内 部 分 区 并 行 性 (intra-partition parallelljsm)。 默 
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认 值 no 对 于 并 发 连接 较 多 的 情况 (主要 是 OLTP) 最 好 ， 而 YES 对 于 并 发 连接 较 少 的 情况 
以 及 复杂 SQL (OLAP/DSS) 来 说 最 好 。 混 合 的 工作 负载 通 瘦 可 以 得 荔 于 NO。 
当局 用 该 参数 时 ， 吏 会 导致 从 共享 内 存 中 分 配 排 序 内 存 。 此 外 ， 如 采 并 发 程度 显著 增 
加 ， 那 么 还 可 能 导致 过 多 的 系统 开销 。 如 条 系统 是 非 OLTP 的 ， 那 么 CPU 数 与 分 区 数 
的 比例 是 4:1, 而 CPU 负载 运行 的 平均 白 分 比 是 50%, intra parallel 很 可 能 会 提高 性 能 。 


4.2.6 mon heap sz 


这 是 为 数据 库 系 统 监视 器 (system monitoD) 数 据 分 配 的 内 存 数 量 。 当 执行 诺 如 快照 监视 
或 激活 事件 监视 器 之 类 的 数据 库 监 控 活 动 时 ， 就 要 从 监视 器 堆 中 分 配 内 存 。 如 果 没 有 足够 
的 可 用 内 存 ， 并 且 DB2 返回 错误 ， 那 么 可 以 试 着 将 这 个 值 设 为 1024。 如 果 还 是 遇 到 错误 ， 
一 次 一 次 地 增加 ， 每 次 增加 256， 直 到 错误 消失 。 


4.3 ”监控 和 调 优 数据 库 级 配置 参数 


下 面 主要 讲解 对 数据 库 性 能 影响 最 重要 的 一 些 配置 参数 。 
这 里 搬 述 的 配置 参数 包括 : 
缓冲 池 大 小 

日 记 绥 冲 区 大 小 

应 用 程序 堆 大 小 

排序 堆 大 小 和 排序 堆 效 值 
代理 程序 的 数目 

锁 相 关 配 置 参数 
活动 应 用 程序 的 最 大 数目 
e。 开 步 页 清除 程序 的 数目 

e JIO 服务 器 的 数 日 


4.3.1 缓冲 池 大 小 

缓冲 池 是 内 存 中 的 一 块 区 域 ， 用 于 临时 读 入 和 更 改 数据 库 页 (包含 表 行 和 索引 项 )。 组 
冲 池 的 用 途 是 为 了 提高 数据 库 系统 的 性 能 。 从 内 存 访问 数据 要 比 从 磁盘 访问 数据 快 得 多 ， 
因此 ， 数 据 库 管理 器 需要 从 磁盘 读 取 或 写 入 磁盘 的 次 数 越 少 ， 性 能 就 越 好 。 对 一 个 或 多 个 
缓冲 池 进行 配置 之 所 以 是 调 优 的 最 重要 方面 ， 在 于 连接 至 数据 库 的 应 用 程序 的 大 多 数 数据 
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(不 包括 大 对 象 和 长 字段 数据 ) 操 作者 是 在 绥 神 池 中 进行 的 。 
默认 情况 下 ， 应 用 程序 使 用 缓冲 池 ibmdefaultbp， 它 是 在 数据 库 创 建 时 创建 的 ， 大 小 


十 automatic。 
1. 建议 


一 定 要 在 instance memory 或 database memory 受 限 的 情况 下 才 允 许 将 缓冲 池 设 定 为 
automatic， 任 则 强烈 建议 设置 成 固定 值 。 
e 一 开始 ， 如 末 您 的 机 需 上 有 足够 大 的 内 存 ， 请 将 bufferpool 的 size 设置 成 65536 
个 页 (256 MB)， 或 者 等 于 机 句 总 内 存 的 10%。 
e 对 于 大 型 OLTP 数据 库 ， 在 你 持 系 统 稳定 的 同时 为 缓冲 池 留 出 尽 可 能 多 的 内 存 。 
一 开始 ， 先 尝试 使 用 4GB( 请 结合 目 己 的 内 存 资 源 ， 此 处 仅 作为 参考 ) 的 内 存 ， 然 后 
尝试 用 更 多 内 存 。 
对 于 大 型 数据 库 ， 除 了 默认 的 缓冲 池 ibmdefaultbp， 我 们 还 可 以 为 多 个 页 大 小 的 表 空 
间 创 建 多 个 缓冲 池 ， 每 个 缓冲 池 的 大 小 取决 于 应 用 程序 和 表 空 间 大 小 。 不 同 缓冲 池 的 创建 
或 调整 请 考虑 下 列 情况 ; 
e 可 以 把 临时 表 空 间 分 配给 单独 的 绥 冲 池 ， 以 便 为 需要 临时 存储 占 的 奏 询 ， 尤 其 是 
执行 大 量 排序 的 奉 询 提供 更 佳 性 能 。 
e 创建 不 同 的 缓冲 池 ， 把 频繁 更 新 的 表 和 索引 放 在 单独 的 绥 冲 池 中 ， 与 其 他 频繁 查 
询 但 不 频 喜 更 新 的 表 和 索引 分 开 。 这 样 两 组 不 同类 型 的 应 用 程序 可 降低 相互 影 啊 
的 可 能 性 。 
e 如果 创建 或 调整 菏 个 缓冲 池 的 大 小 过 大 ， 在 数据 库 局 动 时 内 存 个 可用， 那么 数据 
库 管 理 需 将 使 用 最 小 大 小 为 16 页 的 系统 绥 冲 池 ( 每 个 页 大 小 对 应 一 个 系统 绥 冲 池 ) 
局 动 ， 并 返回 SQL1478W 警告 。 为 了 避免 仅 使 用 系统 缓冲 池 局 动 数据 库 ， 可 用 考 
虑 使 用 db2_overrid_bpf 注册 变量 来 限制 缓冲 池 所 需 的 内 存 。 


2. 缓冲 池 大 小 的 设置 


通过 使 用 “get snapshot for bufferpools on dbname”， 可 以 为 数据 库 中 的 每 个 缓冲 池 生 
成 快照 ， 下 面 的 代码 展示 了 这 样 一 个 快照 : 


Bufferpool snapshot 


Bufferpool name = IBMDEFAULTBP 

Database name BASDE 

Database path = /db2/bamsdb/db2bas/NODEO0000/SOLOO0001/ 
Input database alias = BASDB 
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snapshot 七 Imestamp = UL UL 09:37:23.223386 
Buffer pool data logical reads = 12795178 
Buffer pool data physical reads = 2645 7/ 
Buffer pool temporary data logical reads = 737441 
Buffer pool temporary data physical reads = 0 
Puffer pool data writes = 270 
Buffer pool index logical reads = 5311524 
Buffer pool index physical reads = 29558 
Buffer pool temporary lindex loglical reads = 0 
Buffer pool temporary index physical reads = 0 
Buffer pool xda logical reads = 人 

Buffer pool xda physical reads 二 

BuUffer pool temporary xda logical reads = 0 
Buffer pool temporary xda physical reads = 0 


Buffer pool xda writes = 0 
Total buffer pool read time (milliseconds) = 8727 


Total buffer pool write time (milliseconds)= 225 


Asynchronous pool data page reads = 2032 
Asynchronous pool data page writes — 2063 
Buffer Pool index writes = 71 
Asynchronous pool index page reads = 
Asynchronous pool index page writes = 71 
Asynchronous pool xda page reads = 0 
Asynchronous pool xda page writes = 0 
Total elapsed asynchronous read time 2 
Total elapsed asynchronous write time = 210 
Asynchronous data read requests = 229 
Asynchronous index read requests = ] >] 
Asynchronous xda read requests = 

No victim buffers avalilable = 0 
Direct reads 三 422717118 
Direct writes = 708166 
Direct read requests = 316462 
Direct write requests = 2 3 
Direct reads elapsed time (ms) = 258076 
Direct write elapsed time (ms) 二 
Database flles Closed = 0 
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Unread prefetch pages = 
VECtored FOS dl 
Pages Trom Vectored 1Os = 2418 
Block IOs = 0 
Pages From block IOs = 0 
Node number = 
Tablespaces using bufferpool 二 7 


Alter bufferpool information: 


Pages left to remove = 0 
CUurrent size = 309024 
Post-alter size = 309024 


为 了 判断 缓冲 池 的 效率 ， 震 要 计算 绥 冲 池 命 中 率 (BPHR，Buffer Pool Hit Ratio)。 您 所 
需 的 重要 信息 在 上 面 已 经 用 粗 体 标 出 来 了 。 理 想 的 BPHR 在 某 些 地 方 应 超过 95%。 计 算 
公式 如 下 : 

BPHR (s$) = (1 — (("Buffer pool data physical reads™ + "Buffer pool] index 
physical reads"™) / ("Buffer pool data logical reads™" + "Buffer pool index loglical 
reads™}})}) * 100 

在 ibmdefaultbp 绥 冲 池 的 以 上 快照 中 ， 我 们 可 以 这 样 来 计算 bphr: 

站 有 有 本 

二 5 2) * 1900 
二 人 
= 99.69 


在 这 种 情况 下 ，BPHR 约 等 于 99.69%。 当 前 ， 绥 冲 池 是 309024 * 4KB(4.7GB)。 如 果 
BPHR 值 低 于 9$%， 试 看 增加 该 缓冲 池 的 大 小 ， 看 看 BPHR 是 否 会 随 之 增加 ， 这 样 做 是 值 
得 的 。 如 果 BPHR 还 是 比较 低 ， 那 么 可 能 就 需要 重新 设计 逻辑 布局 了 。 


3. 基于 块 的 缓冲 池 的 效率 


如 果 是 基于 块 的 缓冲 池 ， 并 且 看 到 “Block Ios” 的 值 较 低 ， 那 么 应 考虑 修改 缓冲 池 ， 
增加 numblockpages 的 大 小 。 如 果 这 时 看 到 “了 Block Ios” 的 值 更 大 了 ， 可 以 考虑 将 
numblockpages 笛 增 大 一 些 。 如 果 适 得 其 反 ， 丈 应 减 小 numblockpages 的 大 小 。 


4. 如 何 更 改 该 参数 
运行 下 面 这 段 代码 ， 以 便 : 
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e 验证 syscat.bufferpools 中 bufferpool 的 大 小 
e 修改 bufferpool 的 大 小 


db2 -Vv connect to sample 
do ~“Y “Select * From Sv Seat baliernieels” 
db2 acer butftereool Tbhmletaalttbhp size Diggqer Value™ 


db2 -Vv terminate 


要 硝 定 缓冲 池 大 小 是 否 足 够 大 ， 请 在 运行 应 用 程序 时 收集 数据 库 和 /或 缓冲 池 的 快照 。 
类 似 于 如 下 代码 为 您 所 供 的 信息 : 


db2 -vy update monitor switches using bufferpool on 
qdb2 -vv get monitor switches 

db2 -Vv reset monitor all 

-— run your application —— 

dbz 一 get snapshot for all databases > Snap.out 
db2 -=v get snapshot for dbm >> snap.out 

db2 ~Y get snapshot for all Bufferpools >> snap=out 
db2 -V reset monitor all 


db2 -Vv terminate 


确保 在 断 开 数据 库 连 接 之 前 发 出 “db2 -v get snapshot” 命 令 。 当 最 后 一 个 应 用 程序 与 
数据 库 断 开 连 接 时 ， 该 数据 库 停 止 运 行 ， 同 时 所 有 快照 统计 信息 将 会 丢失 。 要 确保 一 直 存 
在 使 数据 库 处 于 正常 运行 状态 的 连接 ， 请 使 用 下 列 方法 之 一 : 

e 在 收集 快照 的 窗口 中 保持 单独 的 连接 。 

e 使 用 db2 activate database 命令 。 

在 数据 库 快 照 或 缓冲 池 快 照 的 快照 输出 中 ， 答 找 “logical reads” 和 “physical reads” 
以 便 计算 出 缓冲 池 命 中 率 ， 这 可 以 帮助 您 调 优 缓冲 池 : 

Buffer pool data loglical reads = 702033 

Buffer pool data physical reads = 0 

Buffer pool data writes = 414 

Buffer pool index logical reads = 168255 


Buffer pool index physical reads = 0 


绥 冲 池 的 命中 率 表 明 数 据 库 管 理 占 不 需要 从 磁盘 闭 入 由 (该 页 已 经 在 绥 冲 池 中 ) 就 能 处 
理 页 请 求 的 时 间 百 分 比 。 绥 冲 池 的 命中 率 越 融 ， 使 用 磁盘 LO 的 频率 融 越 低 。 


151 


152 


DB2 数据 库 性 能 调整 和 优化 (第 3 版 ) 


注意 : 
以 下 示例 的 输出 取决 于 你 的 缓冲 池 监 控 开 关 是 否 打 开 。 


可 以 使 用 sysibmadm.bp hitratio， 也 可 以 使 用 以 下 SQL 语句 来 获得 缓冲 池 命 中 率 : 


db2 "select snapshot timestamp, substr (db name,1,10) as dbname., 
substr(bp name,l1,18) as bufferpool, total hit ratio percent as total, 
data hit ratio percent as data, index hit rato percent as 1index 


from sysibmadm.bp hitrat1io" 


上 述 计算 考虑 了 缓冲 池 高 速 缓存 的 所 有 页 (索引 和 数据 )。 理 想 情况 下 ， 该 比率 应 当 超 
过 96%， 并 尽 可 能 接近 100%。 要 提 融 缓冲 池 命 中 率 ， 请 尝试 下 面 这 些 方法 : 
e 增加 绥 冲 池 大 小 。 
e 考虑 分 配 多 个 缓冲 池 ， 如 果 可 能 的 话 ， 为 每 个 经 常 被 访问 的 大 表 所 属 的 表 空 间 分 
配 缓冲 池 ， 为 一 组 小 表 分 配 缓冲 池 ， 然 后 尝试 使 用 不 同 大 小 的 缓冲 池 查 看 哪 种 组 
合 会 提供 最 佳 性 能 。 
如 果 已 分 配 的 内 存 不 能 帮助 提高 性 能 ， 那 么 请 避免 给 缓冲 池 分 配 过 多 的 内 存 。 应 当 根 
据 取 目测 试 环境 的 快照 信息 来 决定 缓冲 池 的 大 小 。 


4.3.2 日志 缓冲 区 大 小 (logbufsz) 


logbufsz 是 数据 库 配 置 参数 ， 是 用 于 日 志 缓 冲 区 的 参数 。 这 个 参数 指定 将 日 志 记 录 写 
到 磁盘 之 前 的 绥 神 区 的 数据 库 堆 (dbheap) 的 数量 。 当 提 交 事务 或 者 日 志 缓冲 区 已 满 时 ， 束 
要 将 日 志 记 录 写 入 磁盘 。 对 日 志 记 录 进 行 缓 神 将 导致 将 日 六 记录 与 入 磁盘 的 活动 不 绸 那么 
频繁 ， 但 每 次 要 写 的 日 志 记 录 会 更 多 。 当 下 列 事 件 之 一 发 生 时 会 将 日 志 记录 写 入 做 檀 : 

e 一 个 事务 提交 。 

e 日 记 绥 冲 区 已 满 。 

e 有 太 生 了 其 他 东 些 内 部 数据 库 管 理 器 事件 。 

将 日 志 记 录 存 到 缓冲 区 将 产生 更 加 有 效 的 日 志文 件 TO， 这 是 因为 这 样 一 来 可 以 降低 
将 日 志 记 录 写 入 磁盘 的 频率 ， 同 时 每 次 可 写 更 多 的 日 忘记 录 。 如 果 对 专用 的 日 志 厂 盐 有 相 
当 多 的 读 操作 ， 或 者 希望 有 较 高 的 磁盘 利用 率 ， 那 么 可 以 增加 这 个 缓冲 区 的 大 小 。 当 增加 
这 个 参数 的 值 时 , 也 要 考虑 dbheap 参数 , 因为 日 志 绥 冲 区 使 用 的 空间 由 dbheap 参数 控制 。 
此 数据 库 配 置 参 数 的 默认 值 为 automatic， 这 表示 数据 库 堆 可 以 根据 需要 增 大 ， 直 到 达到 
database memory 限制 或 达到 instance memory 限制 。 
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1. 如 何 更 改 该 参数 


我 们 发 现 该 参数 的 默认 值 为 256(4KB 页 )， 这 对 于 OLTP 数据 库 而 言 通 常 不 够 大 。 
logbufsz 的 最 佳 值 为 512 个 4KB 页 或 者 更 大 。 例 如 , 可 以 使 用 下 面 的 命令 来 更 改 该 参数 的 值 : 


db2 =Y Update db cfgqg for DB NAME asSIn9 LOGBUEFSZ 5312 


db2 -V terminate 
2. 调 优 步 又 


通过 人 三 看 下 和 面 代 公 中 的 各 行 , 使 用 数据 库 快照 (db2 get snapshot for db on db name) 来 确 
定 LOGBUFSZ 参数 的 全 是 否 为 最 佳 值 : 


LoOog Pages Tead = 0 
LOg pages written = 414105 


对 于 OLTP， 一 开始 以 至 少 512 页 为 佳 ， 对 于 OLAP， 则 以 256 页 为 佳 。 如 果 第 党 看 
到 “Log pages read” 大 于 0， 那么 可 能 需要 增加 这 个 值 。 如 来 发 生 回 深 ， 也 可 能 要 读 取 日 
志 页 。 一 般 而 言 ，“]log pages read” 和 “log pages written” 之 比 应 当 尽 可 能 小 。 理 想 情 况 
下 ，“]og pages read” 的 值 应 为 0， 而 “log pages written” 的 值 应 很 大 。 当 “log pages read” 
太 多 时 ， 总 味 看 需要 较 大 的 logbufsz。 

如 果 在 试图 增加 logbufsz 时 收 到 钳 误 ， 那 么 可 以 按 相 同 数量 增加 dbheap， 然 后 册 次 芝 试 。 


4.3.3 ”应 用 程序 堆 大 小 (applheapsz) 


applheapsz 是 数据 库 级 配置 参数 ， 应 用 程序 堆 是 供 数据 库 管 理 融 代表 某 个 特定 代理 使 
用 的 私有 内 存 。 当 代理 或 子 代 理 要 为 应 用 程序 初始 化 时 ， 束 要 从 这 个 堆 中 分 配 内 存 ， 并 且 
分 配 的 内 存 大 小 是 处 理 请 求 时 所 再 的 最 小 内 存量 。 如 宁 需 要 更 多 的 内 存 ， 那 么 最 多 可 以 从 
堆 中 分 配 由 参数 applheapsz 指定 的 最 大 值 那么 多 的 内 存 。 按 256 逐次 增加 , 直到 错误 消失 。 
applheapsz 定义 了 代表 某 个 特定 代理 程序 或 子 代理 程序 的 数据 库 管 理 器 可 以 使 用 的 私有 内 
存 页 数 。 在 为 应 用 程序 初始 化 代理 程序 或 子 代 理 程 序 时 分 配 堆 。 分 配 的 堆 的 大 小 是 处 理 代 
理 程序 或 子 代理 程序 请 求 所 需 的 最 小 值 。 当 代理 程序 或 子 代理 程序 需要 更 多 的 扒 空 间 以 处 
理 较 大 的 SQL 语句 时 ， 数据库 管理 紫 将 按照 需要 分 配 内 存 ， 所 分 配 的 内 存 大 小 最 大 可 达到 
该 参数 指定 的 最 大 值 。 

applheapsz 指 的 是 整个 应 用 程序 可 以 消耗 的 应 用 程序 内 存 的 总 量 。 对 于 DPF、 集 中 夷 
或 SMP 配置 ,这 表示 在 类 似 工作 负载 下 ,除非 使 用 了 automatic 设置 , 否则 可 能 需要 增 大 
在 先前 发 行 版 中 使 用 的 applheapsz 值 。 
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使 用 如 下 命令 可 以 将 该 参数 从 默认 值 更 改 成 最 佳 值 


db2 -vv update db cfqg for db name using applheapsz 256 


db2 -V terminate 
2. 调 优 步 又 


当 应 用 程序 接收 到 表明 应 用 程序 堆 中 存储 空间 不 够 的 错误 时 ， 应 该 增加 applheapsz 
的 值 。 


提示 : 
在 多 层 架 构 的 环境 中 ， 应 用 是 通过 连接 池 连 接 数 据 库 的 ， 建 议 合理 地 增 大 applheapsz 
以 提高 连接 池 的 处 理 效率 。 


4.3.4 sortheap 和 sheapthres_shr 


sortheap 是 数据 库 级 配置 参数 ， 它 定义 了 用 于 私有 排序 的 专用 内 存 页 的 最 大 数目 或 要 
用 于 共 宇 排序 的 共享 内 存 页 的 最 大 数目 。 每 个 排序 都 有 独立 的 排序 堆 ， 这 是 由 数据 库 管 理 
需 在 需要 的 时 候 分 配 的 。 通 音 ， 大 家 都 能 知道 ， 当 排序 所 需 的 内 存量 超过 了 sortheap 时 ， 
就 会 发 生 排 序 洲 出 ; 但 也 有 可 能 没有 注意 到 的 是 ， 如 果 统 计 信息 已 过 时 , 或 者 数据 有 偏差 ， 
并 且 没 有 收集 到 发 布 的 统计 信息 ， 此 时 一 旦 DB2 请 求 太 小 的 堆 , 而 实际 的 排序 操作 超出 了 
所 请 求 的 量 ， 也 会 发 生 湾 出 。 因 此 ， 使 统计 信息 保持 最 新 十 分 重要 。 此 外 ， 应 确保 排序 不 
是 某 个 于 失 的 索引 的 结果 。 如 条 排序 是 私有 排序 , 那么 该 参数 会 影响 代理 程序 的 私有 内 存 ; 
如 果 排 序 是 共 衬 排序 ， 那 么 该 参数 将 影 啊 数 据 库 的 共享 内 存 。 每 个 排序 都 有 单独 的 由 数据 
库 管 理 堪 按 需 分 配 的 排序 堆 。 在 排序 堆 中 对 数据 进行 排序 。 如 条 由 优化 堪 来 指导 排序 堆 大 
小 的 分 配 ， 那 么 用 优化 堪 提 供 的 信息 来 分 配 的 排序 堆 的 大 小 要 小 于 由 该 参数 指定 的 排序 堆 
大 小 。 
sheapthres 也 是 数据 库 级 配置 参数 。 私有 排序 和 共享 排序 所 使 用 内 存 的 来 源 不 一 样 。 共 
吾 排 友和 内 和 存 区 的 大 小 是 在 第 一 次 连接 到 数据 库 时 根据 sheapthres 值 以 静态 方式 预先 确定 
的 。 私 有 排序 内 存 区 的 大 小 则 是 不 受 限 制 的 。 对 于 私有 排序 和 共享 排序 ， 应 用 sheapthres 
参数 的 方式 也 不 同 : 
e 对 于 私有 排序 , sheapthres 是 对 私有 排序 在 任何 给 定 的 时 间 可 以 消耗 的 全 部 内 存 的 
实例 级 “ 软 ” 限 制 。 当 实例 的 总 私有 排序 内 存 消耗 量 达 到 这 一 限制 时 ， 为 其 他 进 
入 的 私有 排序 请 求 而 分 配 的 内 存 会 大 大 减少 。 
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对 于 共 盏 排序 , sheapthres 是 对 共 且 排序 在 任何 给 定 的 时 间 可 以 消耗 的 全 部 内 人 存 的 
数据 库 级 “ 硬 ” 限 制 。 当 达到 这 一 限制 时 ， 不 允许 有 其 他 共享 排序 内 存 请 求 ， 直 
到 总 的 共享 内 存 消耗 量 回落 到 sheapthres 指定 的 限制 之 下 。 


使 用 排序 堆 的 操作 示例 包括 内 存 中 表 的 哈 布 连接 和 操作 .sheapthres 的 显 式 定义 可 以 防 
止 数据 库 管 理 需 将 过 多 数量 的 内 存 用 于 大 量 排序 。 

在 4.2.2 方 中 己 提 人 到 ，sheapthres 参数 已 经 不 青 适用， 建议 设置 sheapthres 为 0。 男 外 通 
过 数据 库 级 参数 sheapthres Ish， 对 排序 内 存 使 用 者 每 次 可 使 用 的 数据 库 共 享 内 存 总 量 进行 


软 限制 。 
1. 建议 
e ”使 用 数据 库 系统 监视 器 来 跟 中 排序 活动 。 
e ”使 用 合适 的 索引 使 排序 堆 的 使 用 降 到 最 低 。 
e 当 需 要 频 过 进 行 大 型 排序 时 ， 增 加 sortheap 的 值 。 
e 如 果 增 加 sortheap， 请 确定 是 人 否 还 沉 要 调整 数据 库 管 理 占 配置 文件 中 的 


本 


sheapthres shr 参数 。 

优化 需 使 用 排序 堆 大 小 来 确定 存 取 路 径 。 在 更 改 该 参数 后 请 考虑 重新 绑 定 应 用 程 
序 ( 使 用 REBIND PACKAGE 命令 )。 

理想 情况 下 ， 应 当 将 sheapthres_shr 合理 地 设置 为 在 数据 库 中 设置 的 sortheap 参数 
最 大 值 的 倍数 。 访 参数 全 少 应 当 是 实例 中 任何 数据 库 定 义 的 最 大 sortheap 的 两 倍 。 


如 何 更 改 这 些 参数 


要 更 改 sortheap 和 sheapthres shr 的 值 ， 请 运行 以 下 命令 


-- 禁 用 sortheap 配置 参数 自 调整 功能 -- 

db2 -V Update db cftgq for DB NAME using sortheap manual 

-- 禁用 sortheap 配置 参数 自 调 整 功能 , 同时 将 sortheap 当前 值 改 为 4094-- 
db2 -=v update db cfg for DB NAME using sortheap 4096 

—— ahaeaptihires shr 是 数据 库 级 参数 -- 

db2 =v update db cfg for DB NAME Using sheapthres shr 131072 


db2 -vv terminate 


调 优 步 又 


对 于 OLTP 应 用 程序 ， 不 应 该 执行 大 型 排序 。 大 型 排序 在 CPU 和 LO 资源 方面 的 消 
耗 成 本 太 高 了 。 通常 ，sortheap 的 默认 值 automatic 就 是 够 了 。 事实 上 , 对 于 高 并 发 性 OLTP， 
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您 可 能 希望 降低 这 个 默认 值 。 当 需要 进一步 研究 时 ， 可 以 发 出 下 面 这 条 命令 
db2 -V update monitor switches using sort on 
然后 ， 让 您 的 应 用 程序 运行 一 会 儿 ， 然 后 运行 : 


db2 ~v getLt snapshot for database on sample 


但 看 如 下 输出 结果 : 

Total Private Sort heap allocated = 
Total Shared Sort heap allocated = 128 
shared Sort heap high water mark dl0233 
Post threshold sorts (shared memory) = 0 
Total ‘sorts 和 
Total sort time (ms) = T41423 
Sort overflows = 
Active sorts = | 

Commit statements attempted = 298304 
Rollback statements attempted 二 
Dynamic statements attempted = ZZ9L3291 
static statements attempted = 26615722 
Falled statement operations = 3133 


根据 该 输出 ， 可 以 计算 每 个 事务 的 排序 数目 ， 并 计算 次 出 了 可 用 于 排序 的 内 存 的 那 部 
分 排序 的 百分比 。 


SortsPerTransaction = (Total Sorts) / (Commlt statements attempted + 
Rollback statements attempted) 


PercentSortOverflow = (Sort overflows * 100 ) / (Total sorts) 


经 验 : 如 果 SortsPerTransaction 大 于 S， 那 么 可 能 表明 每 个 事务 的 排序 太 多 。 如 果 
PercentSortOverflow 大 于 3%， 那 么 可 能 发 生 了 严重 的 、 未 曾 预 料 到 的 大 型 排序 。 发 生 这 
种 情况 时 ， 增 加 sortheap 只 会 隐藏 性 能 问题 ， 却 无 法 修正 。 这 个 问题 的 正确 解决 方案 是 通 
过 添加 正确 的 索引 来 改进 有 问题 的 SQL 语句 的 存 取 方案 。 对 于 OLTP，, 一 开始 最 好 是 设 为 
32768; 对 于 OLAP， 则 设置 在 32768 到 65536 之 间 。 如 果 有 很 多 的 “Sort overflows”[( 两 
位 数 )， 那 么 很 可 能 需要 增加 sortheap。 如 果 “Number of hash join overflows” 丰 为 0， 束 按 
照 8192 逐次 增加 sortheap， 直 到 为 0。 如 果 “Number of small hash join overflows” 不 为 0， 
就 按 10% 的 比例 逐次 增加 sortheap， 直 到 小 散 列 连接 溢出 数 为 0。 
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4.3.5” 锁 相关 配置 参数 


以 下 这 些 与 锁 相 关 的 控制 参数 都 是 数据 库 级 配置 参数 : 

e locklist 表明 分 配给 锁 列 表 的 存储 容量 。 每 个 数据 库 都 有 锁 列 表 ， 锁 列表 包含 了 并 
发 连接 到 数据 库 的 所 有 应 用 程序 持 有 的 锁 。“ 人 锁定” 是 数据 库 管 理 需 用 来 控制 多 
修 应 用 程序 并 发 访问 数据 库 中 数据 的 机 制 。 行 和 表 都 可 以 被 锁定 。 

e maxlocks 定义 了 单个 应 用 程序 持 有 的 锁 列 表 的 白 分 比 上 限 ， 在 数据 库 管 理 器 执行 
锁 升 级 之 前 必须 填充 锁 列 表 。 妆 应 用 程序 使 用 的 锁 列 表白 分 比 达到 maxlocks 时 ， 
数据 库 管理 需 会 升级 这 些 锁 ， 这 意味 看 用 表 锁 代 登 行 锁 ， 从 而 减少 锁 列 表 中 锁 的 
数量 。 当 任何 应 用 程序 持 有 的 锁 数 量 达到 整个 锁 列 表 大 小 的 这 个 百分比 时 ， 对 应 
用 程序 持 有 的 锁 进 行 锁 升级。 如 果 锁 列表 用 完了 空间 ， 那 么 也 会 发 生 锁 升级 。 数 
据 库 管理 器 通过 得 看 应 用 程序 的 锁 列 表 并 得 找 行 锁 最 多 的 表 ， 决 定 对 哪些 锁 进 行 
升级 。 如 果 用 表 锁 符 换 这 些 行 锁 ， 将 不 冉 会 超出 maxlocks 信 ， 那 么 锁 升 级 惑 会 俘 
止 。 合 则 , 锁 升 级 融会 一 下 进行 , 直到 持 有 的 锁 列表 白 分 比 低 十 maxlocks。 maxlocks 
参数 乘 以 maxappls 参数 的 值 不 能 小 于 100。 


注意 ; 
虽然 锁 升 级 过 程 本 身 并 不 用 花 很 多 时 间 ， 但 是 锁定 整个 表 (相对 于 锁定 个 别 行 ) 降 低 了 
并 发 性 ， 而 且 数 据 库 的 整体 性 能 可 能 会 由 于 对 受 锁 升 级 影响 的 表 的 后 续 访 问 而 降低 。 


使 用 下 列 步 又 确定 所 壳 的 锁 列表 : 每 个 数据 库 都 有 锁 列 表 ， 锁 列表 包含 所 有 同时 连接 
到 数据 库 的 应 用 程序 持 有 的 锁 。 在 32 位 平台 上 ， 对 象 上 的 第 一 个 锁 要 求 占 64 字 节 ， 而 其 
他 的 锁 要 求 占 32 子 广 。 在 64 位 平台 上 ， 第 一 个 锁 要 求 占 112 学 节 ， 而 其 他 的 锁 要 求 占 56 
EE 

注意 : 


也 ,可 以 这 样 理解 ，S 锁 占 32 或 56 字 节 : 及 锁 占 64 或 112 字 节 。 


当 应 用 程序 使 用 的 locklist 的 百分比 达到 maxlocks 时 ， 数 据 库 管理 器 将 执行 一 次 锁 升 
级 (lock escalation),， 在 这 个 过 程 中 会 将 行 锁 换 成 单独 的 表 锁 。 而 且 ， 如 果 locklist 快要 耗 尽 ， 
数据 库 管 理 需 将 找 出 持 有 表 上 行 锁 最 多 的 连接 ， 将 这 些 行 锁 换 成 表 锁 以 释放 locklist 内 存 。 
锁定 整个 表 可 以 大 大 减少 并 发 性 ， 但 死 锁 和 锁 等 竺 的 几率 也 增加 了 。 

(1) 计算 锁 列 表 大 小 的 下 限 : (512 * 32* maxappls) /4096。 其 中 ，512 是 每 个 应 用 程序 
平均 所 含 锁 数 量 的 估计 值 ，32 是 对 象 (已 有 一 把 锁 ) 上 每 把 锁 押 需 的 字 节 数 。 

(2) 计算 锁 列 表 大 小 的 上 限 : (512 * 64 * maxapplsy/ 4096。 其 中 ，64 是 某 个 对 象 上 第 一 
把 锁 所 需 的 字 节 数 。 
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(3) 对 于 您 的 数据 ， 估 计 可 能 具有 的 并 友 数 ， 并 根据 您 的 预计 结果 为 锁 列 表 选 择 初 始 
值 ， 该 值 位 于 您 计算 出 的 上 限 和 下 限 之 则 。 
使 用 数据 库 系 统 监视 堪 调 优 maxlocks。 
设置 maxlocks 时 ， 请 考虑 锁 列 表 的 大 小 (locklisb: 
maxlocks = 100 * (512 锁 / 应 用 程序 * 32 字 节 / 锁 * 2) / (locklist * 4096 字 节 ) 
上 述 公 式 允 许 任 何 应 用 程序 持 有 的 锁 是 平均 数 的 两 倍 。 如 果 只 有 几 个 应 用 程序 并 发 地 
运行 ， 可 以 增 大 maxlocks， 因 为 在 这 种 条 件 下 锁 列表 空间 中 不 会 有 太 多 和 争 用 。 
locktimeout 指定 了 应 用 程序 为 获取 锁 所 等 每 的 秒 数 , 这 有 助 于 应 用 程 订 避 人 免 全 局 死 锁 。 
e 如 条 将 该 参数 设置 成 0， 那么 应 用 程序 将 不 等 待 获取 锁 。 在 这 种 情形 中 ， 如 采 请 求 
时 没有 可 用 的 锁 ， 那 么 应 用 程序 立刻 会 接收 到 - 911 错误 。 
。 如 果 将 该 参数 设置 成 - 1， 那 么 将 关闭 锁 超 时 检测 。 在 这 种 情形 中 ， 应 用 程序 将 等 
竺 获取 锁 ( 如 条 请 求 时 没有 可 用 的 锁 )， 一 直到 被 授予 了 锁 或 出 现 死 锁 为 止 。 


1. 建议 


设置 locktimeout 以 快速 检测 由 于 异常 情形 而 出 现 的 等 待 ， 例 如 事务 被 延迟 了 (可 能 是 
由 于 用 户 离开 了 他 们 的 工作 站 )。 将 它 设置 得 足够 高 ,这样 有 效 的 锁 请求 就 不 会 因为 高 峰 时 
的 工作 负载 而 超时 ， 在 高 峰 时 等 待 获取 锁 的 时 间 将 延长 。 

在 联机 事务 处 理 (OLTP) 环 境 中 ， 这 个 值 从 30 秒 开始 。 在 只 进行 查询 的 环境 中 则 可 以 
从 一 个 更 大 的 值 开始 。 无 论 哪 种 情况 ， 都 可 以 使 用 基准 测试 技术 来 调 优 该 参数 。 


2. 如 何 更 改 这 些 参 数 


要 更 改 锁 参 数 ， 请 运行 以 下 命令 : 

db2 -V update db cfqg for DB NAME using locklist a number 
db2 -V update db cfg for DB NAME using maxlocks b number 
db2 -V update db cfg for DB NAME using locktimeout c¢ number 


db2 一 7 terminate 
3. 监控 步 又 


一 旦 锁 列 表 满 ， 由 于 锁 升 级 会 生成 更 多 的 表 锁 和 更 少 的 行 锁 ， 因 此 减少 了 数据 库 中 共 
享 对 象 的 并 发 性 ， 从 而 降低 了 性 能 。 另 外 ， 应 用 程序 间 可 能 会 发 生 更 多 死 锁 ( 因 为 它们 都 等 
竺 数量 有 限 的 表 锁 )， 这 会 导致 事务 被 回 滚 。 当 数据 库 的 锁 请 求 达 到 最 大 值 时 ， 应 用 程序 将 
接收 到 值 为 - 912 的 SQLCODE。 如 果 锁 升级 造成 性 能 方面 的 问题 ， 那 么 可 能 需要 增 大 
locklist 参数 或 maxlocks 参数 的 值 。 可 以 使 用 数据 库 系 统 监视 右 来 确定 是 否 发 生 了 锐 升 级 ， 
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跟踪 应 用 程序 (连接 ) 东 迪 锁 超时 的 次 数 或 者 数据 库 检 测 到 的 所 有 已 连接 应 用 程序 的 超时 
情形 。 


首先 ， 运 行 下 面 的 命令 以 打开 针对 锁 的 DB2 监视 需 : 


db2 -V update monitor switches using lock on 


db2 -Vv terminate 

然后 收集 数据 库 快照 ; 

db2 -Vv get snapshot for database on DB NAME. 
在 快照 输出 中 ， 检 得 下 列 各 项 


Locks held currently = 0 


LOck Wwaits = 0 
Time database walted on locks (ms) = 0 
Lock list memory in use (Bytes) = 504 


Deadlocks detected = 0 


Lock escalations = 8 

Exclusive lock escalations = 12 
Agents currently waiting on locks = 0 
Lock Timeouts = 0 


Internal rollbacks due to deadlock = 0 


如 果 “Lock list memory in use (Bytes)” 超 过 定义 的 locklist 大 小 的 50%, 残 增 加 locklist 
数据 库 配 置 参 数 中 4KB 页 的 数量 。 如 果 发 生 了 “Lock escalations>0” 或 “Exclusive lock 
escalations>0”， 就 应 该 增加 locklist 或 maxlocks， 抑 或 同时 增加 两 者 。 查 看 “Locks held 
currently” ~、“ Lock waits” 、“ Time database waited on locks (ms) 、“ Agents currently waiting 
on locks” 和 “Deadlocks detected” 中 是 奋 存 在 局 值 ， 如 果 有 的 话 ， 就 可 能 是 差 于 最 优 访 问 
计划 、 事 务 时 间 较 长 或 应 用 程序 并 发 问题 的 症状 。 为 了 发 现 死 锁 ， 需 要 创建 针对 死 锁 的 事 
件 监视 器 。 事 件 监 视 器 这 有 话 细 信息 ， 以 便 得 看 当前 正在 发 生 的 事情 。 锁 升级 、 锁 超时 和 
死 锁 将 表明 系统 或 应 用 程序 中 存在 某 些 潜在 问题 。 锁 定 问 题 通常 表明 应 用 程序 中 存在 一 些 
相当 严重 的 并 友 性 问题 ， 在 增 大 锁 列 表 参 数值 之 前 应 当 解 决 这 些 问 题 。 指 定 应 用 程序 在 获 
得 锁 之 前 所 等 竺 的 秒 数 (locktimeoub， 这 可 以 帮助 避免 全 局 死 锁 情 况 的 发 生 。 如 果 该 值 为 - 
1， 应 用 程序 将 会 出 现 锁 等 每 。 对 于 生产 系统 中 的 OLAP， 一 开始 为 60 ( 秒 ) 比 较 好 ; 对 于 
OLTP， 大 约 为 10 秒 比 较 好 。 对 于 开发 环境 ， 应 该 使 用 - 1 以 识别 和 解决 锁 等 待 的 情况 。 
如 末 有 大 量 的 并 发 用 性， 那么 可 能 需要 增加 locktimeout 大 小 以 避 倪 频 橙 回 深 。 

如 果 “Lock Timeouts” 是 较 遍 的 数 ， 那 么 可 能 由 以 下 原因 造成 : 
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估 
各 
各 
了 
人 S 


4.3.6 


locktimeout 的 值 太 低 
某 个 事务 持 有 和 锁 的 时 间 有 所 延长 
锐 升 级 


面 是 一 些 控制 锁 列 表 大 小 的 建议 : 


经 党 进行 提交 以 释放 锁 。 

如 果 要 执行 大 量 更 新 ， 更 新 之 前 ， 在 整个 事务 期 间 锁 定 整 个 表 ( 使 用 SQL LOCK 
TABLE 语句 )。 这 里 使 用 了 一 把 锁 ， 从 而 防止 其 他 事务 妨碍 这 些 更 新 ， 但 对 于 其 
他 用 户 却 减 少 了 数据 并 发 性 。 

使 用 ALTER TABLE 语句 的 locksize 参数 控制 如 何在 持久 基础 上 对 某 个 特定 表 进 
行 锁 定 。 

在 业务 逻辑 允许 的 情况 下 确保 应 用 程序 使 用 最 低 的 隔离 级 别 。 

查看 应 用 程序 使 用 的 隔离 级 别 。 使 用 可 重复 读 (Repeatable Read) 隔 离 级 别 在 某 些 情 
况 下 可 能 会 导致 目 动 执 行 表 锁 定 。 当 有 可 能 减 少 所 持 有 共享 锁 的 数量 时 ， 可 以 使 
用 游标 稳定 性 (Cursor Stability) 隔 离 级 别 。 如 果 没 有 损害 应 用 程序 完整 性 需求 ， 那 
么 可 以 使 用 未 提交 读 (Uncommitted Read) 隅 离 级 别 而 不 是 游标 稳定 性 隔离 级 别 ， 从 
而 进一步 减少 锁 的 数量 。 尽 量 使 用 Cursor Stability 隔离 级 别 ( 默 认 情 况 )， 以 便 减 
少 被 持 有 的 共享 锁 的 数量 (如 条 应 用 程序 能 够 承受 胜 谈 ， 那 么 Uncommitted Read 
可 以 进一步 减少 锁 )。 


活动 应 用 程序 的 最 大 数目 (maxappls) 


maxappls 是 数据 库 配 置 参数 , 它 指定 了 可 以 连接 到 数据 库 的 并 发 应 用 程序 (本 地 和 远程 ) 
的 最 大 数量 。 由 于 需要 为 连接 到 数据 库 的 每 个 应 用 程序 分 配 一 些 私 有 内 存 ， 因 此 人 允许 有 更 
多 并 发 应 用 程序 将 意味 看 用 挥 更 多 内 存 。 该 参数 的 值 必须 大 于 等 于 ， 已 连接 应 用 程序 的 数 
量 加 上 这 些 应 用 程序 中 在 完成 提交 或 回 深 过 程 中 可 能 并 发 存在 的 应 用 程序 数量 的 总 和 。 

当 应 用 程序 尝试 连接 数据 库 ， 但 是 连接 到 数据 库 的 应 用 程序 数 已 经 达到 了 maxappls 


的 值 时 ， 


大 值 : 


会 向 应 用 程序 返回 下 面 这 个 错误 ， 表 明 连 接 到 该 数据 库 的 应 用 程序 数 已 达到 了 最 


SQL1040N The maximum number of applications 1is already connected to the 


database. SOLSTATE=5 /030 


建议 使 用 默认 值 automatic， 即 允许 任何 数目 的 已 连接 应 用 程序 。 数 据 库 管理 器 将 动态 


分 配 以 支持 新 应 用 程序 所 需 


的 资源 。 
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4.3./ pckcachesz 


包 缓存 用 作 静 态 和 动态 SQL 语句 的 缓存 部 分 ， 它 能 够 帮助 数据 库 管 理 器 减少 内 部 开 
销 ， 因 为 避免 了 在 重新 猴 载 包 时 访问 系统 编目 ;或 者 ， 对 于 动态 SQL 来 识 避 免 了 重新 编 详 。 
pckcachesz( 用 于 定义 包 绥 存 大 小 的 参数 ) 应 该 大 于 “Package cache high water mark 
(Bytes)”。 如 果 通 过 db2 get snapshot for db on dbname 看 到 的 “Package cache overflows” 
不 为 0， 那 么 可 以 答 试 通过 增加 pkgcachesz 来 使 这 个 计数 需 变 为 0。 
Package Cache Hit Ratio (PCHR) 应 该 尽 可 能 接近 100%( 而 个 是 从 绥 冲 池 中 获取 所 需 的 
闪存)。 可 以 用 下 面 的 公 坏 来 计算 : 


PCHR = (1-( "Package cache inserts"/ "Package cache lookups"))*100 
4.3.8 catalogcache sz 


这 个 参数 用 于 缓存 系统 编目 信息 ， 例 如 systables、 授 权 和 sysroutines 等 信息 。 绥 存 编 
目 信 息 十 分 重要 ， 尤 其 是 在 使 用 DPF 的 情况 下 。 因 为 不 必 为 获得 先前 已 经 检索 过 的 信息 
而 访问 系统 编目 (编目 分 区 )， 从 而 减少 了 内 部 开销 。 

不 断 增加 该 值 ， 直 到 OLTP 的 Catalog Cache Hit Ratio (CCHR) 达 到 95% 或 更 好 的 值 : 


CCHR = (1-( "Catalog cache inserts"/ "Catalog cache lookups"))*100 


如 果 “Catalog cache overflows ”的 值 大 于 0, 也 要 增加 该 参数 的 值 。 还 可 以 使 用 “Catalog 
cache high water mark(Bytes) ”来 确定 编 日 缓存 曾 消 耗 过 的 最 大 内 存 。 如果“High water mark” 
等 于 允许 的 Maximum 大 小 ， 融 需要 增加 编目 缓存 堆 的 大 小 。 


4.3.9 异步 页 清除 程序 的 数目 num_iocleaners) 


num iocleaners 是 数据 库 配 置 参 数 ， 该 参数 指定 数据 库 中 开 步 页 面 清除 匿 的 数量 。 弄 
步 页 面 清除 器 用 于 将 更 改 后 的 页 面 从 绥 冲 池 写 到 位 盘 。 一 开始 将 这 个 参数 设 为 守 于 系统 中 
CPU 的 数量 。 当 触发 了 LO Cleaners 时 ， 它 们 会 同时 局 动 。 因 此 ， 您 可 能 不 希望 有 那么 多 
的 清除 器 ， 以 致 影 啊 性 能 和 阻 堵 其 他 处 理 过 程 。num iocleaners 还 可 以 让 您 指定 数据 库 中 
异步 页 清除 程序 的 数目 。 在 数据 库 代 理 程 序 需要 组 神 池 中 的 宕 间 之 前 ， 这 些 页 清除 程序 将 
缓冲 池 中 己 更 改 的 页 写 到 磁盘 。 这 人 允许 代理 程序 不 必 等 等 已 更 改 页 被 写 到 磁盘 就 可 以 读 取 
新 页 。 因 此 ， 这 会 加 快 应 用 程序 事务 的 执行 。 

如 果 将 该 参数 设置 成 0， 将 不 局 动 页 清除 程序 ， 络 果 是 数据 库 代 理 程序 将 绥 神 池 中 的 
所 有 页 号 到 磁盘 。 该 参数 会 对 存储 在 多 个 物理 存储 设备 上 的 单个 数据 库 的 性 能 产生 显著 影 
啊 ， 这 是 因为 在 这 种 情况 下 其 中 霖 个 设备 极 有 可 能 处 于 空闲 状态 。 如 采 没 有 配置 页 清除 程 
序 ， 应 用 程序 可 能 会 过 到 严重 的 性 能 问题 。 
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如 条 连接 到 数据 库 的 应 用 程序 主要 执行 更 新 数据 的 事务 ， 那 么 增加 清除 程序 的 数目 会 
过 局 性 能 。 增 加 页 清除 程序 的 数量 还 会 减少 “ 软 ” 故 障 (比如 断 电 ) 的 恢复 时 间 ， 因 为 磁盘 
上 数据 库 的 内 容 在 任何 给 定时 间 部 是 比较 新 的 。 

当 设 置 该 参数 的 值 时 需要 考虑 下 而 这 些 因素 : 

e 如 朵 有 多 个 事务 针对 数据 库 运 行 ， 将 该 参数 的 值 设置 在 1 到 该 数据 库 所 使 用 的 物 
理 存储 右 的 数量 之 间 。 建 议 将 该 参数 的 值 设置 成 全 少 您 系统 上 CPU 的 数量 。 
在 共有 局 更 新 事务 率 的 环境 下 ， 可 能 需要 配置 较 多 的 页 清除 程序 。 


涡 
e 在 具有 大 绥 冲 池 的 环境 下 ， 也 可 能 需要 配置 较 多 的 页 清除 程序 。 
1. 如 何 更 改 该 参数 


可 以 用 下 面 的 命令 来 为 该 参数 设置 新 值 : 


db2 -~v update db cfg for sample using NUM IOCLEANERS a number 


db2 -Vv terminate 
2. 调 优 步 又 


使 用 数据 库 系 统 监视 器 ， 利 用 有 关 从 绥 冲 池 进 行 号 操作 的 快照 数据 (或 事件 监视 器 ) 信 
县 来 帮助 和 您 调 优 该 配置 参数 。 
当 使 用 快照 和 收集 缓冲 池 的 快照 数据 时 ， 监 控 下 列 计 数 骨 : 


Ruffer pool data writes = 12400 


Asynchronous pool data page writes = 450 
Buffer pool index writes = 239 
Asynchronous pool index page writes = 201 


LSN Gap cleaner triggers = 0 


Dirty page steal cleaner triggers = 0 


Dirty page threshold cleaner triggers = 0 


如 何 决定 该 减少 还 是 增加 num_iocleaners 
如 果 Asynchronous Write Percentage(AWP) 是 90% 或 更 高 ， 减 少 num iocleaners; 如 果 
Asynchronous Write Percentage(AWP) 小 于 90%6， 增 加 num iocleaners。 
AWP = (( "Asynchronous pool data page writes"+ "Asynchronous pool index page 
writes™) 100})} / ( "Buffer pool data writes"+ “Buffer pool index writes"™) 
“Dirty page steal cleaner triggers ”指出 因为 在 数据 库 “ 受 损 ” 绥 六 区 替换 期 间 需 要 同 
步 写 操作 而 调用 页 清除 程序 的 次 数 。 为 了 有 喝 好 的 啊 应 时 则 ， 该 数值 应 当 尽 可 能 低 。 利 用 
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上 面 所 示 的 计数 匿 ， 可 以 使 用 下 面 的 公式 计算 所 有 清除 程序 调用 的 百分比 : 


Dirty page steal cleaner triggers / (Dirty page steal cleaner triggers +Dirty 


page threshold cleaner triggers +LSN Gap cleaner triggers) 


如 果 该 比率 很 高 ， 那 么 可 能 表明 您 所 定义 的 页 清除 程序 太 少 了 。 页 清除 程序 太 少 会 使 
故障 恢复 时 间 变 长 。 
4.3.10 ”异步 I/O 服务 器 的 数目 (num_ioservers) 

诸如 备份 和 恢复 之 类 的 实用 程序 使 用 IO 服务 器 代表 数据 库 代 理 程 序 执行 预 取 IO 和 
异步 VO 操作 。 该 参数 是 数据 库 配 置 参数 ， 用 于 指定 数据 库 的 IO 服务 需 的 数目 。 超 过 这 
个 数量 的 预 取 和 实用 程序 IO 在 任何 时 候 都 不 能 在 数据 库 中 执行 。 在 启动 IO 操作 时 ，LO 
服务 需 处 于 等 竺 状态 。LIO 服务 器 用 于 执行 预 取 操 作 ， 而 此 参数 则 指定 数据 库 中 LO 服务 
需 的 最 多 数量 。 非 预 取 IO 是 从 数据 库 代 理 调度 的 ， 因 此 不 受 此 参数 的 约束 。 

1. 如 何 更 改 该 参数 


可 以 使 用 下 面 的 命令 为 num ioservers 设置 莉 值 : 


db2 -Vv update db cfg for DB NAME using NUM IOSERVERS a number 


db2 -Vv terminate 
2. 建议 


一 开始 将 该 参数 设置 为 数据 库 所 跨 的 物理 磁盘 数 (磁盘 阵列 中 的 许多 磁盘 或 者 逻辑 卷 
中 的 许多 人 磁盘) 加 上 1 或 2， 但 是 不 大 于 CPU 数量 的 4 到 6 倍 。 

如 果 很 快 就 看 到 “Time waited for prefetch (ms)”， 那 么 或 许可 以 添加 IO 服务 器 ， 以 
查看 性 能 是 否 有 提高 。 


4.3.11 avg appls 


只 有 在 应 用 程序 发 出 复杂 的 SQL( 例 如 连接 、 国 数 、 递 归 等 ) 命 令 时 才 更 改 这 个 参数 ， 
售 则 让 它 一 直 为 1。 这 可 以 帮助 您 估计 在 运行 时 可 以 为 访问 计划 提供 多 少 缓冲 池 容 间 。 该 
参数 应 该 设 为 较 低 的 值 ， 即 “Applications connected currently” 的 平均 数 乘 以 复杂 SQL 命 
令 的 上 分 比 。 当 此 参数 设置 为 automatic 时 , 在 创建 数据 库 配 置 文件 或 者 重新 设置 数据 库 配 
置 文 件 时 ， 会 立即 将 此 参数 更 新 为 适当 的 值 。 设 置 此 参数 可 以 帮助 优化 器 更 准确 地 模拟 绥 
冲 池 的 使 用 量 。 如 果 您 手动 设置 此 参数 ， 无 论 您 运行 的 应 用 程序 的 平均 数 是 多 少 ， 值 都 是 
从 2 开始 。 在 您 采用 此 设置 来 评估 优化 占 的 行为 和 测试 应 用 程序 的 性 能 之 后 , 可 以 按 较 小 
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的 增 量 来 增 大 此 参数 的 从 。 每 当 您 增 大 此 参数 的 值 时 ， 请 继续 评估 优化 费 的 行为 并 测试 应 
用 程序 的 性 能 。 将 此 参数 的 值 设 得 太 大 可 能 会 导致 优化 亏 低 佑 可 用 于 得 询 的 绥 神 池 空间 量 。 
器 改 此 参数 的 值 之 后 ， 请 考虑 使 用 REBIND PACKAGE 命令 重新 绑 定 应 用 程序 。 


4.3.12 chngpgs thresh(DB) 


使 用 这 个 参数 可 以 指定 缓冲 池 中 被 更 改 页 面 所 占 的 百分比 ， 此 时 将 局 动 寞 步 的 员 面 清 
除 紫 ， 将 更 改 瑟 入 人 磁盘 以 便 在 绥 冲 池 中 为 新 的 数据 腾 出 空间 。 在 只 读 环 境 下 ， 不 使 用 页 面 
清除 天 。 在 OLTP 中 ,使 用 20 到 40 之 间 的 值 应 该 可 以 提高 性 能 (在 更 新 活动 庞大 的 情况 下 
使 用 20)， 因 为 使 这 个 值 更 低 一 些 将 使 WO Cleaners 从 脏 缓冲 池 页 面 写 出 数据 次 数 更 多 ,但 
是 每 次 做 的 工作 却 变 少 了 。 如 果 没 有 很 多 的 INSERT 或 UPDATE, 那么 对 于 OLTP 和 OLAP 
来 说 ， 默 认 的 60 应 该 束 比 较 好 了 。 

如 果 “Dirty page steal cleaner triggers” 是 两 位 数 , 那么 试看 降低 。 如果 “Buffer pool data 
writes” 较 高 ， 而 “Asynchronous pool data page writes” 较 低 ， 那 么 试看 降 低 这 个 参数 。 

DB2 还 提供 另 一 种 页 面 清除 算法 ， 这 种 算法 可 以 提高 特定 绥 神 池 的 性 能 。 您 需要 设置 
概要 注册 变量 db2 use alternate page cleaning 为 on， 这 样 将 忽略 chngpgs thresh。 确 保 
num ioservers 人 至少 为 3， 盏 则 它 会 拖 新 算法 的 后 腿 。 


4.3.13 maxtilop 


这 个 参数 用 于 指定 每 个 数据 库 代 理 所 能 打开 的 最 大 文件 数 。 如 果 打 开 文 件 时 被 打开 的 
文件 数 超 出 了 这 个 什 ， 束 要 关闭 该 代理 正在 使 用 的 一 些 文 件 。 过 度 打 开 和 关闭 都 会 降低 性 
能 。SMS 表 空 间 和 DMS 表 空 间 文 件 容 需 者 被 视 作文 件 来 对 符 。 通 第 SMS 使 用 的 文件 要 
时 多 一 些 ， 

增加 该 参数 的 值 ， 直 到 “Database files closed” 为 0。 


4.3.14 logprimary、logsecond 和 |ogfilsz 


logprimary 指定 要 预先 分 配 空间 的 主 日 志文 件 的 数量 , 而 logsecond 则 是 按照 需要 来 分 
配 空间 的 。logfilsiz 用 于 定义 每 个 日 志文 件 的 大 小 。 

如 果 “Secondary logs allocated currently” 的 值 很 大 ， 那 么 可 能 需要 增加 logfilsiz 或 
logprimary( 但 要 确保 logprimary 加 上 logsecond 的 和 不 超过 256)。 还 可 以 使 用 “Maximum total 
log space used (Bytes)” 来 帮助 指出 对 日 志文 件 空间 ( 主 日 志 加 上 从 日 志 ) 的 依赖 性 。 

日 志文 件 的 大 小 对 灾难 恢复 有 一 定 的 影响 ， 因 为 在 灾难 恢复 中 要 使 用 日 志 发 送 (log 
shipping)。 日 志文 件 比 较 大 时 ， 性 能 会 更 好 些 ,， 但 是 会 潜在 地 加 大 丢失 事务 的 几率 。 当 主 
系统 骨 尝 时 ， 最 近 的 日 志文 件 及 其 事务 可 能 无 法 发 送 到 从 系统 ， 因 为 在 失败 之 前 没有 关闭 
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该 文件 。 日 志文 件 越 大 ， 随 大 日 志文 件 的 丢失 ， 于 失事 务 的 可 能 性 也 越 大 。 

为 此 参数 选择 的 值 取决 于 许多 因素 ， 包 括 正在 使 用 的 记录 类 型 、 日 志文 件 的 大 小 和 处 
理 环境 的 类 型 (例如 ， 事 务 的 长 度 和 提交 的 频率 )。 增 大 此 值 将 增 大 日 志 的 磁盘 要 求 ， 因 为 
主 日 志文 件 就 是 在 与 数据 库 的 第 一 个 连接 期 间 预 分 配 的 。 如 果 您 发 现 经 常 分 配 辅助 日 志文 
件 ， 那 么 可 通过 增 大 日 志文 件 大 小 (logfilsiz) 或 增 大 主 日 志文 件 的 数目 来 提高 系统 性 能 。 

结合 logfilsiz 设置 修改 日 志 数 量 ， 根 据 具 体 数 据 库 需求 ， 必 须 修 改 主 日 志 的 数量 ， 比 
如 较 小 的 事务 系统 可 以 将 logprimary 设置 为 13， 对 于 较 大 的 事务 系统 设置 成 23 或 更 大 。 

对 于 定期 需要 大 量 日 志 空 间 的 数据 库 ， 使 用 辅助 日 志文 件 。 例 如 ， 每 月 运行 一 次 的 应 
用 程序 需要 的 日 志 空 间 可 能 会 超过 由 主 日 志文 件 提供 的 日 志 空 间 。 由 于 辅助 日 志文 件 不 需 
要 永久 的 文件 空间 ， 因 此 辅助 日 志文 件 在 这 种 情况 下 有 优势 。 

局 用 无 限 记 录 功 能 (将 logsecond 设置 为 1) 之后， 数据 库 管 理 占 不 会 为 需要 回 深 和 写 

志 记 录 的 事务 保留 活动 日 志 空 间 。 在 回 滚 处 理 期 间 ， 如 果 活 动 日 志 路 径 和 归档 目标 都 已 

满 (或 者 归档 目标 不 可 访问 )， 那 么 blk log dsk ful(“ 日 志 磁 盘 满 时 阻止 进行 日 志 记 录 ” 数 
据 库 配 置 参 数 ) 也 应 该 设置 为 enabled 以 避免 发 生 数 据 库 故障 。 建 议 将 logsecond 初始 值 设 
置 成 37 或 更 大 的 值 。 


4.3.15 stmtheap 


语句 堆 用 于 在 SQL 语句 编 详 期 间作 为 编 详 亏 的 工作 区 。 对 于 每 一 条 归 处 理 的 SQL 语 
句 ， 痢 要 从 该 区 域 分 配 和 释放 空间 。 如 末 收 到 党 告 信 息 或 销 误 信息 ， 那 么 可 以 按 256 逐次 
增加 该 参数 的 值 ， 直 到 销 误 消失 。 此 参数 对 数据 库 性 能 影响 重大 ， 建 议 合理 调 整 ， 如 朱 您 
的 应 用 程序 收 到 SQL0437W 管 告 ， 且 奏 询 的 运行 时 性 能 不 足 ， 那 么 您 可 能 要 考虑 增加 
stmtheap 值 (后 层 为 automatic 的 值 或 固定 值 )， 从 而 确保 动态 编程 连接 枚 举 能 够 成 功 。 


4.3.16 dft queryopt 


用 于 指定 在 编译 SQL 查询 时 使 用 的 默认 优化 级 别 。 对 于 混合 的 OLTP/OLAP， 使 用 5 
或 3 作为 默认 值 ， 对 于 OLTP， 使 用 更 低 的 级 别 ， 而 对 于 OLAP， 则 使 用 更 高 的 级 别 。 对 
于 简单 的 SELECTS 或 短 的 运行 时 查询 (通常 只 需要 兹 费 不 到 1 秒 钟 就 可 以 完成 )， 使 用 1 
或 0 也许 比较 合适 。 如 果 有 很 多 的 表 ， 有 很 多 相同 列 上 的 连接 谓词 ， 那 么 请 尝试 级 别 1 或 
2。 对 于 超过 30 秒 钟 才 能 完成 的 长 时 间 运 行 的 查询 ， 或 者 如 果 要 插入 UNION ALL VIEW， 
那么 可 以 尝试 使 用 级 别 7。 在 大 多 数 环境 下 部 应 该 避免 使 用 级 别 9。 


4.3.17 utl heap sz (DB) 


该 参数 指定 BACKUP、RESTORE 和 LOAD 实用 程序 可 以 同时 使 用 的 最 大 内 存 数 。 如 
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果 正 在 使 用 LOAD， 那 么 对 于 每 个 CPU， 建议 将 util heap sz 设置 成 至 少 10000 页 。 为 了 
提高 备份 、 恢 复 和 凄 载 的 速度 ， 建 议 增 大 该 参数 。 如 果 此 参数 设置 得 太 低 ， 您 可 能 无 法 并 
行 运行 实用 程序 。 应 该 根据 需要 动态 更 新 此 参数 。 如 果实 用 程序 较 少 ， 那 么 将 此 参数 设置 
为 较 小 的 值 。 如 果实 用 程序 较 多 ， 或 者 实用 程序 消耗 的 内 存 较 多 ， 那 么 应 该 将 此 参数 设置 
为 较 大 的 值 。 


4.4 调整 DB2 概要 注册 变量 


DB2 概要 注册 变量 通常 会 影响 优化 器 和 DB2 引擎 本 身 的 行为 。 虽 然 概 要 注册 变量 有 
很 多 ， 但 是 其 中 的 大 部 分 都 有 非常 特定 的 用 途 ， 因 而 在 大 部 分 的 DB2 环境 中 都 不 会 用 到 。 
本 节 我 们 主要 介绍 的 是 一 些 影响 性 能 的 常用 的 概要 注册 变量 。 

表 4-2 列 出 了 用 于 概要 注册 表 一 些 基 本 管理 命令 : 


表 4-2 ”概要 注册 表 管 理 命令 
命 令 拉 述 
db2set -all 列 出 当前 设置 的 所 有 DB2 注册 变量 
db2set -g | -i variable=value 设置 指定 的 DB2 注册 变量 ， 使 其 处 于 全 局 (- 多 级 或 实例 (- 级 


=- = 
) 土 忆 : 


变量 和 值 之 间 不 要 有 空格 ， 否 则 变量 会 重新 被 设置 成 默认 值 。 
4.4.1 db2 parallel Io 


默认 值 为 NULL。 值 : Tapjespace1D[:1]，…… 一 一 定义 表 空 间 ( 由 数字 表 空 间 标识 识别 ) 
的 速 号 分 隔 列 表 。 如 果 表 衬 间 的 了 预 取 大 小 为 automatic， 那 么 可 以 通过 指定 表 空间 标识 ， 后 
面 跟 一 个 冒号 ， 再 加 上 每 个 容器 中 的 磁盘 数 n， 疝 DB2 数据 库 管 理 器 表示 该 表 空 间 的 每 个 
容器 中 的 磁盘 数 。 如 果 没 有 指定 n， 那 么 使 用 默认 值 6。 

可 以 将 TablespaceID 和 奉 换 为 星 号 (和 来 指定 所 有 的 表 空 间 。 例 如 ， 如 条 
db2_parallel io=*， 那 么 所 有 表 空 间 都 将 使 用 6 作为 每 个 容器 中 的 磁盘 数 。 如 条 同时 指定 
星 号 (*) 和 表 空 间 标 识 ， 那 么 优先 使 用 表 空 间 标 识 设 置 。 例 如 ， 如 果 db2 parallel io=*, 1:3， 
那么 所 有 表 衬 间 都 将 使 用 6 作为 每 个 容 句 中 的 磁盘 数 ， 但 是 第 一 个 表 空 间 除 外 ( 它 将 使 用 
3 作为 每 个 容器 中 的 磁盘 数 )。 

此 注册 变量 用 来 更 改 DB2 计算 表 空 间 的 IO 并 行 性 的 方式 。 当 启用 了 LO 并 行 性 时 (要 
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么 通过 使 用 多 个 容 吉 来 隐 陈 局 用 ， 要 么 通过 设置 db2 parallel io 来 显 式 局 用 )， 通过 发 出 正 
人 硝 数 目的 预 取 请 求 来 实现 此 目标 。 每 个 预 取 请 求 都 是 对 页 的 扩展 数据 块 的 请 求 。 例 如 ， 表 
空间 有 两 个 容 髓 ， 并 且 预 取 大 小 是 扩展 数据 块 大 小 的 4 倍 。 如 末 设 置 了 此 注册 变量 ， 那 么 
对 此 表 衬 间 的 预 取 请 求 将 分 为 4 个 请 求 (每 个 请 求 针 对 一 个 扩展 数据 块 )， 并 且 可 以 使 用 4 
个 预 取 程序 并 行 处 理 这 些 请 求 。 

如 果 表 空间 中 的 各 个 容器 分 布 在 多 个 物理 磁盘 上 ， 或 者 表 空 间 中 的 容器 是 在 由 多 个 物 
理 磁盘 组 成 的 单个 RAID 设备 上 创建 的 ， 那 么 您 可 能 需要 设置 此 注册 变量 。 

如 果 未 设置 此 注册 变量 ， 那 么 任何 表 衬 间 的 并 行 度 都 是 表 空 间 的 容 需 数 。 人 例如， 如果 
将 db2 parallel io 设置 为 NULL， 并 且 表 空间 有 4 个 容器 ， 那 么 将 发 出 4 个 按 扩展 数据 块 
大 小 计算 的 预 取 请 求 ， 或 者 ， 如 果 表 空间 有 两 个 容 匿 ， 并 且 预 取 大 小 是 扩展 数据 块 大 小 的 
4 倍 ， 那 么 对 此 表 衬 间 的 预 取 请 求 将 分 为 两 个 请 求 (每 个 请 求 对 应 两 个 扩展 数据 块 )。 

如 果 设 置 了 此 注册 变量 ,， 并且 表 的 预 取 大 小 不 是 automatic， 那 么 表 空 间 的 并 行 度 为 预 
取 大 小 除 以 扩展 数据 块 大 小 。 例 如， 如果 对 预 取 大 小 为 160 而 扩展 数据 块 大 小 为 32 页 的 表 
空间 设置 了 db2 parallel io， 那 么 将 发 出 5$ 个 按 扩展 数据 块 大 小 计算 的 预 取 请 求 。 

如 果 设 置 了 此 注册 变量 ， 并 且 表 空间 的 了 预 取 大 小 是 automatic， 那 么 DB2 使 用 下 面 的 
公式 目 动 计 算 表 空间 的 预 取 大 小 : 


预 取 大 小 = (容器 数 ) * (每 个 容器 的 磁盘 数 )* 扩展 数据 块 大 小 
表 4-3 总 结 了 可 用 的 不 同 选 项 和 在 每 种 情况 下 计算 并 行 性 的 方式 。 


表 4-3 计算 并 行 性 的 公子 


automatic( 预 取 大 小 = 容器 数 # 加 哺 


automatic( 预 取 大 小 = 容器 数 # 
6* 扩展 数据 块 大 小 ) 


automatic( 预 取 大 小 = 容器 数 # 
n* 扩展 数据 块 大 小 ) 


上 E automatic 表 空 间 标识 预 取 大 小 /扩展 数据 块 大 小 
上 lE automatic 表 空 间 标识 : n 了 预 取 大 小 /扩展 数据 块 大 小 


表 空间 标识 容器 数 * 6 


表 空 间 标 识 : n 寂 器 数 了 
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例如 , 假设 您 有 3 个 表 空 间 , 标识 分 别 为 3、4 和 5。 它们 的 扩展 数据 块 大 小 (extend size) 
为 4096 字 节 ， 每 个 表 空 间 各 有 两 个 容器 。 表 空间 3 和 4 的 预 取 大 小 均 为 automatic， 而 表 
空间 $ 的 预 取 大 小 为 16384 字 节 。 假 设 您 设置 了 db2 parallel io=*#:$，4:10， 那 么 每 个 表 衬 
e 表 衬 间 3 值 x( 每 个 容器 中 的 磁盘 数 ) 为 S， 扩 展 数据 块 大 小 =4096， 容 器 数 =2， 预 
取 大 小 为 automatic。 因 此 ， 预 取 大 小 为 2*5*4096 ， 并 行 性 = 容器 数 * pn =2*#S=10。 
e 表 宇 间 4 注意 此 表 空 间 的 值 (每 个 容器 中 的 磁盘 数 ) 被 特别 设置 为 10。 扩 展 数据 
块 大 小 =4096， 容 器 数 =2， 预 取 大 小 为 automatic。 因 此 ， 预 取 大 小 =2*10*4096， 并 
行 性 = 容器 数 *n=2*10=20。 
e。 表 宇 间 5 值 n 仍 为 5， 但 它 没 有 任何 作用 ， 因 为 预 取 大 小 不 是 automatic。 扩 展 数 
据 块 大 小 =4096， 容 器 数 =2， 预 取 大 小 =16384。 因 此 ， 并 行 性 = 预 取 大 小 /扩展 数据 
块 大 小 =16384/4096=4。 
在 茶 些 情况 下 ， 使 用 此 变量 可 能 导致 磁盘 争 用 。 人 例如， 如果 表 空间 有 两 个 容器 ， 每 个 
容 右 有 专用 的 单个 人 磁盘， 那么 设置 此 注册 变量 可 能 导致 这 些 磁盘 发 生 争 用 ， 原 因 是 两 个 预 
取 程 序 将 同时 访问 两 个 磁盘 中 的 每 个 磁盘 。 但 是 ， 如 果 每 个 容器 都 分 布 在 多 个 磁盘 上 ， 那 
么 设置 此 注册 变量 将 潜在 允许 同时 访问 4 个 不 同 的 磁盘 。 
要 激活 对 此 注册 变量 的 更 改 ， 请 发 出 db2stop 命令 ， 然 后 输入 db2start 命令 。 


4.4.2 db2 evaluncommitted 


该 参数 在 “第 $ 草 : 锁 和 并 发 ”中 有 非 弟 详细 的 手 述 ， 此 处 不 在 次 述 。 
4.4.3 db2 skipdeleted 
该 参数 在 “第 $ 革 : 锁 和 并 发 ”中 有 非 音 详细 的 描述 ， 此 处 不 在 悍 述 。 


4.4.4 db2 skipinserted 


该 参数 在 “第 5 草 : 锁 和 并 友 ” 中 有 非 营 详细 的 描述 ， 此 处 不 在 资 述 。 


4.4.5 db2 use page container tag 


操作 系统 : 所 有 操作 系统 。 

默认 值 ; NULL 。 

值 : ON 或 NULL。 

默认 情况 下 ，DB2 将 容器 标记 存储 在 每 个 DMS 容器 的 第 一 个 扩展 数据 块 中 ， 而 无 
论 它 是 文件 还 是 设备 。 容 右 标 记 是 容器 的 元 数据 。 在 DB2 V8.1 之 前 ， 容 需 标 记 存 储 在 单 
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个 页 中 。 因 此 ， 它 在 容 堪 中 需要 较 少 的 空间 。 要 继续 将 容器 标记 存储 在 单个 页 中 ， 请 将 
db2 use page container tag 设置 为 ON。 

但 是 , 如 果 在 对 容器 使 用 RAID 设备 时 将 此 注册 变量 设置 为 ON, 那么 将 会 降低 IO 性 
能 。 因 为 对 于 您 使 用 等 于 RAID 条 市 大 小 或 其 倍数 的 扩展 数据 块 大 小 创建 表 空 间 的 RAID 
设备 ， 将 db2 use page container tag 设置 为 ON 会 导致 扩展 数据 块 不 与 RAID 条 市 对 章 。 
因此 ，LIO 请 求 可 能 需要 访问 相对 于 优化 的 物理 磁盘 更 多 的 磁盘 。 蝇 更 建议 用 户 不 要 局 用 
此 注册 变量 ， 除 非 有 非 音 严格 的 宕 间 约 束 ， 或 者 您 要 求 行为 与 DB2 V8 之 前 的 数据 库 行为 
保持 一 致 。 

要 激活 对 此 注册 变量 的 更 改 ， 请 发 出 db2stop 命令 ， 然 后 执行 db2start 命令 。 
4.4.6 db2 selectivity 


操作 系统 : 所 有 操作 系统 。 

堆 认 值 : No。 

值 : Yes 或 No。 

此 注册 变量 控制 在 SQL 语句 的 搜索 条 件 中 可 以 使 用 SELECTIVITY 子 句 的 情况 。 
当 此 注册 变量 设置 为 “Yes” 时 ， 可 以 为 下 列 谓 词 指 定 SELECTIVITY 了 名 : 

e 全 少 有 一 个 表达 式 包 含 主 变量 的 基本 谓词 。 

e 其 中 的 MATCH 表达 式 、 请 词 表 达 式 或 转 义 表达 式 包含 主 变 量 的 LIKE 谓词 。 


4.4./ db2maxfscrsearch 


操作 系统 : 所 有 操作 系统 

e 四 认 值 : 5 

e 值 : -1 以 及 1 到 33 554 

指定 在 将 记录 添加 人 至 表 中 时 ， 要 搜索 的 可 用 空间 控制 记录 (FSCR) 的 数量 。 默 认 情 况 是 
搜索 5 个 FSCR。 修 改 此 值 允许 您 平衡 插入 速度 与 空间 复 用 。 使 用 较 大 的 值 将 优化 空间 复 
用 ， 使 用 较 小 的 值 将 优化 插入 速度 。 将 值 设 为 -1 会 强制 数据 库 管 理 顺 搜索 所 有 FSCR。 


4.5 ”内 存 目 动 调 优 


从 IBM DB2 V9 开始 ， 一 种 狐 的 内 存 调 优 特性 ( 目 调 优 内 存 管 理 ) 通 过 目 动 设置 几 个 内 
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存 配置 参数 值 的 方式 ， 简 化 了 内 存 配 置 任务 。 内 存 调整 器 一 旦 启用 ， 就 能 够 在 几 个 内 存 使 
用 者 (包括 排序 、 程 序 包 绥 存 、 锁 定 列 表 和 组 神 池 ) 之 间 动 态 地 分 配 可 用 内 存 资 源 。 

此 调整 露 工作 在 database memory 配置 参数 定义 的 内 存 限 制 范 围 之 内 ， 而 
database memory 的 值 本 号 可 在 Windows 和 AI 平台 上 目 动 调 优 。 当 局 用 了 针对 
database memory 的 目 调 优 之 后 (通过 将 其 设置 成 automatic)，DB2 内 存 调整 器 会 硝 定 数据 
库 的 总 内 存 需 求 ， 并 会 根据 当前 的 数据 库 需 求 增 加 或 减少 分 配给 数据 库 共 胖 内 存 的 容量 。 
例如 ， 如 采 当 前 的 数据 库 需 求 很 高 ， 而 系统 又 有 下 够 的 空 亲 内存， 数据库 内 存 束 可 以 使 用 
较 多 的 内 存 资源 。 一 旦 数据 库 内 存 的 需求 降低 ， 或 系统 的 空闲 内 存量 过 低 ， 一 部 分 数据 库 
共享 内 存 就 会 被 释放。 

图 4-1 摘 述 了 在 内 存 目 动 调 优 机 制 中 数据 库 与 操作 系统 之 间 内 存 互动 的 基本 流程 。 


E 否 可 以 从 操作 系统 
中 获得 更 多 内 存 


图 4-1 内 存 自 动 调 优 机 制 
4.5.1 内存 自动 调 优 示例 
图 4-2 显示 的 示例 来 日 局 动 了 内 三 目 动 调 优 的 数据 库 ， 此 例 来 源 于 IBM.， 
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图 4-2 ”内 存 自 动 调 优 的 效果 


在 上 述 示 例 中 ， 第 一 个 数据 库 局 动 的 时 候 ， 数 据 库 分 配 的 共 圣 内 存 很 少 ， 但 是 随 看 数 
据 库 负载 的 增加 ， 内 存 的 需求 也 在 不 断 增加 。 由 于 在 操作 系统 级 别 没 有 其 他 的 应 用 参与 内 
存 的 竞争 ， 因 而 可 以 不 断 地 从 操作 系统 中 获得 内 人 存 ， 直 到 不 能 再 获得 为 止 。 

当 第 二 个 数据 库 局 动 的 时 候 ， 数 据 库 分 配 的 共 圣 内 存 同 样 很 少 。 同 样 ， 随 者 数据 库 负 
载 的 增加 ， 有 内 存 的 需求 也 在 不 断 增 加 。 但 是 操作 系统 中 已 经 没 有 空闲 的 内 存 能 够 分 配 了 ， 
所 以 只 能 从 DB2 的 其 他 heap 中 获取 内 存 ， 第 一 个 数据 库 中 已 经 分 配 的 内 存 会 祝 逐渐 转移 
到 第 二 个 数据 库 中 ， 下 到 两 个 数据 库 达 到 一 定 程度 的 平衡 。 

在 第 二 个 数据 库 停止 之 后 ， 由 于 个 册 有 内 存 的 竞争 者 ， 因 此 这 一 个 数据 库 义 会 逐步 地 
获得 所 有 的 内 存 ， 从 而 获得 最 大 的 数据 处 理 能 力 。 

上 面 的 示例 充分 揭示 了 DB2 的 内 存 上 日 动 调 优 机 制 如 何在 数据 库 与 操作 系统 之 则 、 数据 
库 与 数据 库 之 间 目 动 地 调整 内 存 的 分 配 ， 以 使 数据 库 在 一 般 意 义 上 获得 足够 、 合 理 的 内 存 


4.5.2 启用 内 存 目 动 调 优 及 相关 参数 
1. 数据 库 内 存 配 置 


DB2 中 的 参数 database memory 用 于 控制 数据 库 中 内 存 总 量 的 什 ， 通 过 将 
database memory 设置 成 不 同 的 值 可 以 实现 数据 库 级 别 的 内 存 目 动 调 优 。 上 其 体 设置 方式 有 
如 下 几 种 : 
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e 将 database memory 设置 为 automatic， 此 时 ，DB2 中 共享 内 存 的 大 小 可 以 与 操作 
系统 内 存 之 间 目 动 地 进行 调整 。 也 惑 是 说 ， 当 操作 系统 中 有 衬 朵 内 存 的 时 候 ， 数 
据 库 可 以 从 操作 系统 中 获得 内 存 以 满足 负载 的 需求 ; 反之 ， 当 数据 库 中 有 不 需要 
的 内 存 的 时 候 ， 束 可 以 将 其 返还 给 操作 系统 。 

e 将 database Imemory 设置 为 computed， 此 时 ，DB2 的 内 存 总 量 为 数据 库 中 设置 的 
所 有 内 存 之 和 再 增加 20%。 

e 将 database memory 设置 为 大 于 1.2 倍 实际 内 存 总 和 的 数值 ， 此 时 ， 如 果 数 据 库 中 
某 个 设置 为 automatic 的 内 存 heap 需要 更 大 的 内 存 ， 束 可 以 使 用 大 于 总 量 1.2 倍 的 
那 部 分 内 存 。 

在 将 database_ memory 设置 为 automatic 之 后 ， 数 据 库 中 所 有 设置 为 automatic 的 内 存 

heap 就 可 以 获得 最 大 的 灵活 性 。 

在 数据 库 中 可 以 设置 为 目 动 调 优 的 主要 的 内 存 heap 如 下 : 

® sortheap 

© pckcachesz 

® locklist 


. 缓冲 池内 存 配 置 


缓冲 池 是 用 来 在 内 存 中 缓 存 数据 页 的 数据 库 对 象 。 一 旦 数据 页 被 放 入 绥 冲 池 ， 就 可 以 
避免 对 硬盘 的 物理 IO 访问 。 绥 冲 池 可 以 配置 成 只 缓存 某 一 表 空 间 。 绥 冲 池 是 DB2 性 能 调 
优 中 非常 重要 的 部 分 。 如 何 配置 系统 的 实际 和 虚拟 内 存 、DB2 的 内 部 内 存 使 用 ， 以 及 DB2 
绥 神 池 会 极 大 影 啊 系 统 的 性 能 。 可 用 实际 内 存 越 多 ， 整 体 的 性 能 越 好 。 您 可 针对 目 己 系统 
处 理 需 的 数量 对 这 些 因素 进行 均衡 。 实 际 内 存 不 足 会 导致 操作 系统 产生 过 多 的 分 员 ， 而 这 
又 会 影响 到 每 个 应 用 程序 ， 包 括 DB2。 即 使 是 一 页 DB2 数据 已 经 在 缓冲 池内 ， 这 种 情况 
也 仍 会 及 生 ， 怕 因 是 操作 系统 没有 足够 的 内 存 来 在 实际 内 存 中 保存 该 员 ， 操 作 系 统 必 须 将 
它 暂 时 写 出 到 硬盘 中 。 这 种 情况 会 严 午 影 啊 DB2 的 性 能 。 

3. 实例 内 存 配 置 参 数 

DB2 中 实例 内 存 配 置 参 数 instance memory 指定 可 以 为 数据 库 分 区 分 配 的 最 大 内 存量 。 
默认 值 automatic 将 允许 实例 内 存根 据 需要 而 增加 , 在 激活 数据 库 分 区 时 , 目 动 计算 的 值 介 
于 物理 RAM 的 75% 到 95% 之 间 。 在 多 分 区 数据 库 的 服务 上 右上， 该 计算 值 是 除 以 逻辑 分 区 
数 而 获得 的 值 。 


De 
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当 instance memory 设置 为 特定 值 时 ， 数 据 库 管理 器 分 配 的 系统 内 存 最 多 只 能 为 此 限 
制 。 当 达到 此 限制 时 ， 应 用 程序 会 接受 到 闪存 分 配 铺 误 。 如 条 局 用 了 目 调整 
database _ memory， 那么 自 调整 管理 器 (STMM) 将 更 新 配置 以 获得 最 佳 性 能 ， 同 时 还 会 监视 
可 用 系统 内 存 。 通 过 监视 可 用 内 存 ， 可 确 你 不 会 过 量 使 用 系统 内 存 。 这 里 再 要 注意 的 是 ， 
审计 绥 冲 区 (audit buf sz) 的 大 小 不 受 instance memory 的 限制 。 

当 instance memory 设置 为 automatic 时 ， 数 据 库 管 理 咒 将 根据 需要 来 分 配 系 统 内 存 。 
如 果 司 用 了 目 调 整 database _ memory， 那么 STMM 将 更 新 配置 以 获得 最 佳 性 能 ， 同 时 还 会 
监视 可 用 系统 内 存 。 通 过 监视 可 用 内 存 ， 可 确 你 不 会 过 量 使 用 系统 内 存 。 

通过 使 用 db2pd -dbptnmem 命令 或 admin get mem usage 表 了 函数， 我 们 可 以 非常 方便 
地 查看 实例 内 存 耗 用 总 量 以 及 当前 instance memory 耗 用 量 。 


4.5.3 内存 配置 参数 的 配置 原则 


目 DB2 V9 以 后 ， 大 部 分 内 存 参数 的 默认 值 都 是 automatic， 这 大 量 蔬 约 了 数据 库 维 护 
人 员 的 精力 。 当 局 用 目 调 整 内 存 功能 并 对 大 多 数 的 参数 使 用 automatic 设置 时 ,我 们 需要 理 
解 清楚 每 个 配置 参数 的 含义 以 及 相互 的 关联 性 ， 这 样 我 们 就 可 以 更 好 地 控制 它们 的 设置 ， 
能 够 在 特定 场景 中 找到 “内 存 不 足 ” 的 原因 。 

基本 上 ，DB2 数据 库 管 理 器 使 用 两 种 类 型 的 内 存 : 

e 性 能 内 存 : 这 是 用 来 提高 数据 库 性 能 的 内 存 。 人 性 能 内 存 由 目 调 整 内 存 管 理 器 
(STMM) 控 制 并 分 发 给 各 种 性 能 堆 。 可 以 将 database_ memory 配置 参数 设置 为 性 能 
内 存 的 最 大 容量 ， 也 可 以 将 database memory 设置 为 automatic 以 便 STMM 管理 
性 能 内 存 的 全 部 容量 。 

e 功能 内 存 : 此 内 存 由 应 用 程序 使 用 。 可 以 使 用 appl memory 配置 参数 来 控制 DB2 
数据 库 代 理 程 序 为 了 为 应 用 程序 请 求 提 供 服务 而 分 配 的 功能 内 存 (应 用 程序 内 存 ) 
的 最 大 容量 。 默 认 情 训 下 ， 此 参数 设置 为 automatic， 这 和 意味 看 只 要 有 系统 资源 可 
用 ,就 允许 功能 内 存 请 求 。 如 果 要 使 用 具有 内 存 使 用 限制 的 DB2 数据 库 产 品 ， 或 
者 将 instance memory 设置 为 特定 值 ， 那 么 在 数据 库 分 区 分 配 的 内 存 总 量 未 超过 
instance memory 限制 的 情况 下 ， 将 强制 使 用 instance_ memory 限制 并 且 人 允许 功能 
内 存 请 求 。 


实例 和 数据 库 内 存 自 调整 的 关联 


在 automatic 设置 可 用 之 前 ， 可 以 使 用 各 种 操作 系统 或 DB2 工具 (db2mtrk) 来 全 看 不 同 
类 型 的 内 存 (例如 共享 内 存 、 专 用 内 存 、 缓 冲 池内 存 、 锁 定 列 表 、 排 序 内 存 ( 堆 ) 等 等 ) 耗 用 的 
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空间 量 。 如 果 其 中 某 个 堆 达 到 内 存 限 制 , 那么 应 用 程序 中 的 某 条 语句 将 失败 ,并 且 显 示 “内 
存 个 是 ”错误 消 奶 。 现在， 可 以 使 用 号 省 的 automatic 配置 参数 来 去 除 各 个 功能 内 存 扒 的 便 
上 限 。 

当 目 调整 内 存 管 理 堪 (STMMD) 处 于 活动 状态 并 且 司 用 了 数据 库 内 存 的 目 调整 功能 时 ， 
STMM 将 检查 系统 中 的 可 用 内 存量 ,并 日 动 确定 为 了 获取 最 佳 性 能 而 应 该 供 性 能 堆 专 用 的 
内 存量 。 所 有 性 能 堆 都 将 计 入 database memory 总 大 小 。 除 了 性 能 内 存 需 求 以 外 ， 还 需要 
一 定 内 存 来 确 你 DB2 数据 库 管 理 费 的 操作 和 完整 性 。 如 果 示 施加 instance memory 限制 ， 
那么 对 单个 应 用 程序 可 分 配 的 内 存量 没有 其 他 限制 。 

如 果 存 在 instance_ memory 限制 ，STMM 还 会 定期 查询 剩余 的 可 用 系统 内 存量 以 及 剩 
余 的 可 用 instance memory 空间 量 。 为 了 防止 应 用 程序 发 生 故 障 ，STMM 认为 应 用 程序 震 
求 优 先 于 性 能 条 件 。 有 需要 时 ， 将 通过 减少 可 供 性 能 堆 使 用 的 空间 量 使 性 能 下 降 ， 从 而 提 
供 足 够 的 可 用 系统 内 存 和 instance memory 衬 间 以 满足 应 用 程序 内 存 请 求 。 应 用 程序 完成 
时 ， 使 用 的 内 存 将 被 释放 ， 从 而 可 供 其 他 应 用 程序 重复 使 用 或 者 为 database _ memory 回收 
以 供 STMM 使 用 。 

根据 以 上 对 instance memory 和 database memory 的 摘 述 ， 建 议 在 生产 数据 库 环 境 中 ， 
把 instance_ memory 设置 成 固定 值 。 通 过 此 硬 上 限 ， 可 以 避免 数据 库 和 应 用 程序 过 多 抢占 
主机 的 内 存 资源 。 在 数据 库 级 别 则 建议 把 database memory 设置 成 automatic， 让 目 调 整 拓 
人 存 管理 器 调节 不 同类 型 的 内 存 。 


4.6 ”本 章 小 结 


以 上 列 出 了 在 数据 库 管理 过 程 中 ， 与 性 能 有 关 的 最 主要 的 配置 参数 ， 这 些 参数 分 为 实 
例 参数 、DB 参数 和 DB2 注册 变量 。 其 中 ，DB2 注册 变量 的 有 效 范围 可 以 是 全 局 级 别 或 实 
例 级 别 ， 实 例 参数 的 有 效 范围 是 整个 实例 ， 这 包括 了 实例 中 创建 的 所 有 数据 库 ，DB 参数 
的 有 效 范围 是 当前 的 数据 库 。 

在 实际 的 生产 环境 中 ， 正 确 、 合 理 地 设置 这 些 参数 对 数据 库 的 性 能 影响 至 关 重 要 ， 不 
合理 的 参数 设置 往往 会 造成 严重 的 性 能 问题 。 

在 性 能 问题 上 ， 数 据 库 参数 的 调整 往往 不 是 简单 、 一 次 性 的 步骤 ， 而 应 该 是 循序 渐进 、 
循环 处 理 的 过 程 。 因 为 在 发 生性 能 问题 需要 对 参数 进行 调整 的 时 候 ， 很 少 能 确定 地 知道 只 
要 将 某 个 或 几 个 参数 设置 为 特定 的 值 就 可 以 达到 最 好 的 效果 。 为 了 达到 最 好 的 调整 效果 ， 
就 需要 由 调整 到 监控 、 再 到 调整 的 持续 循环 过 程 。 所 以 性 能 参数 的 调整 通常 具有 持续 性 的 
特点 。 


锁 和 并 发 


我 们 在 进行 性 能 问题 分 析 时 遇 到 最 多 的 问题 之 一 就 是 锁 。“ 为 什么 DB2 锁 住 了 这 个 
表 、 行 或 对 象 ? “这 个 锁 会 阻 融 多 长 时 间 及 为 什么 ?2“ 为 什么 出 现 了 有 死 锁 ? 盖 “ 我 的 
锁 请 求 在 等 竺 什么 ?””， 诸 如 此 类 等 。 仔 细 地 分 析 一 些 第 见 的 锁 示 例 ， 可 以 说 明 DB2 锁定 
宁 略 育 后 的 原则 。 很 多 DB2 用 户 乔 会 碰 到 有 关 锁 等 待 、 死 锁 和 锁 升 级 等 与 锁 相 关 的 问题 。 
在 本 章 中 ， 我 们 将 会 对 这 些 问 题 进行 详细 讲解 ， 并 介绍 如 何 解决 这 些 问题 。 

本 章 主 要 讲解 以 下 内 容 : 

e 锁 的 概念 
锁 的 属性 、 策 略 和 模式 
隅 离 级 别 的 概念 及 使 用 
锁 转 换 、 锁 等 待 、 锁 升级 和 死 锁 
与 锁 有 关 的 性 能 问题 
锁 与 应 用 程序 设计 
锁 监 控 工 具 及 应 用 案例 


最 大 化 并 友 性 
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5.1 锁 的 概念 


5.1.1 数据 一 致 性 
理解 数据 一 致 性 


什么 是 数据 一 致 性 ? 我 们 通过 示例 来 回答 这 个 问题 。 假 定 你 的 公司 拥有 多 家 连锁 饭 
店 ， 公 司 使 用 数据 库 来 跟踪 每 家 饭店 中 的 货物 存储 量 。 为 了 使 货物 的 采购 过 程 更 方便 ， 数 
据 库 中 包含 了 每 个 连锁 店 的 库存 表 。 每 当 一 家 饭店 收 到 或 用 掉 一 部 分 货物 时 ， 与 该 饭店 相 
对 应 的 库存 表 就 会 被 修改 以 反映 库存 变化 。 

现在 , 假定 从 一 家 店 调配 若干 瓶 番茄 将 到 另 一 家 店 。 为 了 准确 地 表示 这 一 次 库存 调配 ， 
调 出 方 饭 店 表 中 存储 的 番 茹 桨 瓶 数 必须 减少 ， 而 接收 方 饭 店 表 中 存储 的 番茄 效 瓶 数 必须 增 
加 。 如 果 用 户 减 少 调 出 方 饭店 库存 表 中 的 番茄 酱 瓶 数 ， 但 没有 增加 接收 方 库存 表 中 的 番茄 
次 瓶 数 ， 数 据 就 会 出 现 不 一 致 。 此 时 ， 所 有 连锁 店 的 番茄 效 的 总 瓶 数 就 不 准确 了 。 

如 果 用 户 忘 记 了 进行 所 有 必要 的 更 改 (正如 前 面 示例 中 的 一 样 )， 或 者 在 进行 更 改 的 过 
程 中 系统 崩溃 了 ， 又 或 者 数据 库 应 用 程序 由 于 某 种 原因 过 早 地 停止 了 ， 那 么 数据 库 中 的 
数据 就 都 变 得 不 一 致 。 当 几 个 用 户 同时 访问 相同 的 数据 库 表 时 ， 也 可 能 发 生 不 一 致 。 为 
了 防止 数据 的 不 一 致 (尤其 是 在 多 用 户 环境 中 )，DB2 的 设计 中 集成 了 下 列 数据 一 致 性 支持 
机 人 制 | 

。 事务 

。 锁 


e 隔离 级 别 
5.1.2 事务 和 事务 边界 


委 爷 (也 称 为 工 白 尝 罗 是 一 种 将 一 个 或 多 个 SQL 操作 组 合成 单元 的 可 恢复 操作 序列 ， 
通常 位 于 应 用 程序 进程 中 。 事 务 的 启动 和 终止 定义 了 数据 库 的 一 致 性 ; 要么 将 事务 中 执行 
的 所 有 SQL 操作 的 结果 部 应 用 于 数据 库 ( 提 交 )， 要 么 完全 取消 并 丢弃 已 执行 的 所 有 SQL 
操作 的 结果 ( 回 深 )。 

运行 车 入 陈 SQL 应 用 程序 或 脚本 ， 在 可 执行 SQL 语句 第 一 次 执行 时 (在 建立 与 数据 库 
的 连接 之 后 或 在 现 有 事务 终止 之 后 )， 事务 束 会 自动 启动 。 事 务 在 启动 之 后 ， 必 须 由 启动 囊 
务 的 用 户 或 应 用 程序 显 式 地 终止 ,除非 使 用 了 称 为 自动 提交 (automatic commit) 的 过 程 (在 这 
种 情况 下 ， 发 出 的 每 条 单独 的 SQL 语句 被 看 作 单 个 事务 ， 一 执行 束 被 隐 式 地 提交 了)。 

在 大 多 数 情 况 下 ， 通 过 执行 COMMIT 或 ROLLBACK 语句 来 终止 事务 。 当 执行 
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COMMIT 语句 时 , 自从 事务 局 动 以 来 对 数据 库 所 做 的 一 切 更 改 就 成 为 永久 性 的 了 一 一 它们 
被 写 到 磁盘 。 当 执行 ROLLBACK 语句 时 ， 目 从 事务 启动 以 来 对 数据 库 所 做 的 一 切 更 改 都 
被 撤销 ， 并 且 数 据 库 返回 到 事务 开始 之 前 所 处 的 状态 。 不 管 是 哪 种 情况 ， 数 据 库 在 事务 完 
成 时 都 保证 能 回 到 一 致 状态 。 

1. COMMIT 和 ROLLBACK 操作 的 效果 

正如 前 面 提 到 的 ， 通 常 通过 执行 COMMIT 或 ROLLBACK SQL 语句 来 终止 事务 。 为 
了 理解 这 些 语句 如 何 工 作 ， 我 们 看 下 面 的 示例 。 

如 果 按 所 示 的 顺序 执行 下 列 SQL 语句 (由 3 个 事务 组 成 的 简单 工作 负载 ): 


CONNECT TO SAMPLE 

CREATE TABLE DEPARTMENT (DEPT ID INTEGER NOT NULL, DEPT NAME VARCHAR (20)) 
INSERT INTO DEPARTMENT VALUES(100, “PAYROLL") 

INSERT INTO DEPARTMENT VALUES (200, "ACCOUNTING") 

COMMIT 


INSERT INIO DEPARTMENT VALUES (300, "SALES') 
ROLLBACK 


INSERT INTO DEPARTMENT VALUES (5300, "MARKETING") 
COMMIT 


这 将 创建 名 为 DEPARTMENT 的 表 ， 结 构 如 表 5-1 所 示 。 


表 5-1 表 DEPARTMENT 的 结构 


BEPT ID DEPT NAME 
100 PAYROLL 
200 ACCOUNTING 
300 MARKE TING 


当 执 行 第 1 条 COMMIT 语句 时 ， 创 建 名 为 DEPARTMENT 的 表 并 向 表 中 插入 两 条 记 
录 , 这 两 个 操作 都 会 变 成 永久 性 的 。 当 执行 到 ROLLBACK 语句 时 ,删除 插入 DEPARTMENT 
表 中 的 第 3 条 记录 ， 该 表 返 回 到 执行 插入 操作 之 前 所 处 的 状态 。 最 后 ， 当 执行 到 第 2 条 
COMMIT 语句 时 ， 插 入 到 DEPARTMENT 中 的 第 4 条 记录 成 为 永久 性 的 ， 而 数据 库 册 次 
返回 到 一 人 致 状态 。 

从 上 和 面 这 个 示例 中 可 以 看 出 ， 提 交 或 回 深 操 作 只 影响 在 这 个 操作 所 结束 的 事务 内 做 出 
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的 更 改 。 只 要 数据 更 改 仍然 未 被 提交 ， 其 他 用 户 和 应 用 程序 通 各 就 无 法 看 见 它 们 (也 有 例外 
情况 ， 在 本 章 的 最 后 我 们 将 进行 讨论 )， 并 可 以 通过 执行 回 深 操 作 取 消 它 们 。 但 是 ,一旦 数 
据 更 改 被 提交 ， 其 他 用 户 和 应 用 程序 就 可 以 访问 它们 ， 并 且 再 也 不 能 通过 回 深 操作 取消 
它们 。 

2. 不 成 功 事务 的 效果 


我 们 刚才 已 看 到 当 通 过 COMMIT 或 ROLLBACK 语句 终止 事务 时 会 发 生 什 么 。 但 是 ， 
如 条 在 事务 完成 前 出 现 系 统 故障 ， 那 会 发 生 什 么 情况 呢 ? 在 这 种 情况 下 ，DB2 数据 库 管 理 
程序 会 取消 所 有 未 提交 的 更 改 , 从 而 恢复 数据 库 一 人 致 性 (假定 在 事务 局 动 时 就 存在 这 样 的 一 
致 性 )。 赂 5-1 对 比 了 成 功 的 事务 和 在 成 功 终止 之 前 失败 的 事务 的 效果 。 


A successful transaction 


otart transaction Fnd transaction 
Tr SQL operation pe 

三 三 = SQL operation 三 

EE SQL operation 上 EEE 
三 commit = 三 EE 三 

Locks are acquired at When the COMMIT Locks are released 

the start of ,and statement is executed when the transaction 

throughout the life all changes are made is terminated{(by the 

of the transaction permanent COMMIT statement) 


一 3 
Time 


一 一 


A unsuccessful transcation 


SQL operat1ion 
SQL operatlion 
SQL operation 
FRROR condition 


COMmmlit 


dd Locks are released 


End transaction when the error 
Locks are acquired at When an error condition condition OCCUTS, 
the start of, and occurs, the DB2 Database no connections are 
throughout the life Manager removes all changes allowed until 


of the transaction made by the transaction consistency 1S 
restored 


Start transact1ion 


Time 


图 5-1 对 比 成 功 的 和 不 成 功 的 事务 


5.1.3” 锁 的 概念 


在 关系 数据 库 (DB2、Oracle、Sybase、Informix 和 SQL Server 等 ) 中 ， 最 小 的 恢复 和 交 
易 单位 为 事务 ,事务 具有 ACID( 原 子 性 、 一 臻 性、 隔离 性 和 永久 性 ) 特 征 。 关 系数 据 库 为 了 
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确保 并 发 用 户 在 存 取 同一 数据 库 对 象 时 的 正确 性 (无 丢失 更 新 、 可 重复 读 、 不 读 “ 脏 ”数据 、 
无 “ 约 像 ” 读 )、 数 据 库 中 引入 了 并 发 ( 锁 ) 机 制 。 

成 熟 的 关系 数据 库 系 统 应 该 能 够 允许 多 个 应 用 程序 同时 对 相同 数据 进行 访问 。 当 这 种 
情况 发 生 时 ， 要 保证 数据 库 的 完整 性 ， 束 必须 有 一 定 的 机 制 用 于 控制 数据 记录 的 读 取 、 插 
和 入、 删除 和 更 新 。 锁 束 是 这 样 一 种 机 制 。 基 本 的 锁 有 两 种 类 型 : 排 它 锁 (exclusive locks， 记 
为 入 锁 ) 和 共享 锁 (share locks， 记 为 S 锁 )。 

锁 是 一 种 用 来 将 数据 资源 与 单个 事务 关联 起 来 的 机 制 ， 其 用 途 是 当 某 个 资源 与 拥有 它 
的 事务 关联 在 一 起 时 ， 探 制 其 他 事务 如 何 与 资源 进行 交互 。 我 们 称 与 被 锁定 资源 关联 的 事 
务 持 有 或 拥有 该 锁 ，DB2 数据 库 管 理 程序 用 锁 来 禁止 事务 访问 其 他 事务 写 入 的 未 提交 数据 
(除非 使 用 了 未 提交 的 读 隔 离 级 别 )， 并 禁止 其 他 事务 在 拥有 锁 的 事务 使 用 限制 性 隔离 级 别 
时 对 这 些 行进 行 更 新 。 一 旦 获取 锁 ， 在 事务 终止 之 前 ， 怠 一 直 持 有 锁 ; 在 事务 终止 时 释放 
锁 ， 这 样 其 他 事务 就 可 以 使 用 被 解锁 的 数据 资源 了 。 

如 果 一 个 事务 尝试 访问 数据 资源 的 方式 与 男 一 个 事务 持 有 的 锁 不 莱 容 ( 稍 后 我 们 将 研 
究 锁 兼容 性 )， 那 么 这 个 事务 必须 等 得 ， 直到 拥有 锁 的 事务 终止 为 止 。 这 被 称 为 锁 等 待 。 当 
锁 等 符 事 件 友 生 时 ， 和 尝试 访问 数据 资源 的 事务 所 做 的 只 是 停 上 执行， 直到 拥有 锁 的 事务 终 
止 或 不 兼容 的 锁 被 释放 为 止 。 

举 个 例子 ， 假 如 事务 工 对 数据 D 加 入 锁 ， 则 其 他 任何 事务 都 不 能 册 对 D 加 任何 类 型 
的 锁 ， 直 全 工 释放 D 上 的 和 X 锁 ; 一 和 股 要 求 在 修改 数据 前 要 问 数 据 加 排 它 锁 ， 所 以 排 它 错 
又 称 为 与 锁 。 右 事务 工 对 数据 了 D 加 S$ 锁 ， 则 其 他 事务 只 能 对 了 D 加 S 锁 ， 而 不 能 加 和 锁 ， 
百 全 工 释 放 D 上 的 S 锁 ; 一 般 要 求 在 读 取 数据 前 要 问 数 据 加 共 至 锁 ， 所 以 共 圣 锁 又 称 为 读 
锁 。 我 们 可 以 通过 调整 数据 库 的 加 锁 策略 来 适应 一 定 的 并 发 性 需求 。 

通过 对 数据 库 对 象 加 锁 ， 我 们 可 以 避免 以 下 情况 的 发 生 : 


由 于 并 发 更 改造 成 数据 的 丢失 

假设 航空 机 票 代理 1 查询 512 航班 的 所 有 空闲 座位 ， 发 现 有 一 个 座位 空 大 ， 这 时 航 至 
机 票 代理 1 为 某 位 乘客 预定 该 座位 ;与 此 同时 ， 航 空 机 票 代 理 2 也 发 现 了 这 个 空 的 座位 ， 
并 且 也 为 其 他 乘客 预定 ， 结 果 这 两 个 航空 机 票 代 理 都 收 到 预定 成 功 的 结果 ， 但 是 事实 上 ， 
后 提交 的 预定 会 将 先 提交 的 预定 修改 掉 。 

让 我 们 用 数据 库 来 对 上 述 情 况 再 进行 一 下 细致 挡 述 : 

P Read 和 Instuct 两 人 同时 来 到 不 同 的 航空 代理 处 购买 512 航班 的 机 票 , 两 个 代理 都 想 


为 自己 的 顾客 预订 7A 座位 ， 然 后 两 个 代理 同时 输入 下 列 命令 
代理 1: 


update reservations set p name='"'P Read'where flight='512'and seat="'7A'" and 
name Tro nll 
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代理 2: 


update reservations set p name='Instuct' where flight='512" and seat="'7A" 
and pname 13 nulls: 

如 果 没 有 一 定 的 机 制 来 阻止 对 同一 数据 的 并 发 更 改 ， 册 个 代理 痢 会 收 到 更 改 成 功 的 信 
上 县。P Read 和 Instuct 将 会 在 机 场 出 现 并 认为 他 们 都 已 经 预订 好 座位 。 

如 果 使 用 加 锁 机 制 进行 控制 ， 这 种 情况 可 以 避免 。 当 P READ 的 代理 在 更 新 座位 信息 
的 时 候 ， 在 表 中 先 使 用 排 它 锁 对 数据 进行 锁定 ， 然 后 更 刹 ， 更 新 结束 后 再 将 锁 释 放 ， 那 么 
Instuct 的 代理 束 不 可 能 获得 同样 的 座位 信息 。 


读 取 了 未 提交 的 数据 ( 脏 读 ) 

当 可 以 读 取 未 提交 的 数据 时 ， 可 能 会 出 现 “ 脏 谈 ”， 因 为 如 果 这 些 数据 的 修改 被 回 深 ， 
就 会 导致 在 数据 处 理 中 使 用 无 效 数据 。 

图 5-2 说 明了 这 种 场景 。 在 这 里 ， 更 新 了 一 行 并 更 改 了 P-Name 字段 ， 但 是 没有 提交 。 
然后 ， 男 一 个 使 用 UR 隔离 级 别 的 应 用 程序 执行 SELECT 语句 。 因 为 UR 忽略 行 上 的 锁 ， 
所 以 它 将 返回 未 提交 的 仁 。 但 是 ， 更 新 事务 在 提 区 之 前 被 回 滚 。 因 而 ，SELECT 语句 返回 
错误 的 值 。 


Reservations 


1 Update Reservations 2 Select seat z 
人 from ph 
Where Flight = $12 : Where P name is NULL 


and Seat = "7C" 
andP Name ls NULL 


3 Roll back 4 Incorect results set 


图 5-2 读 取 了 未 提交 的 数据 


未 提交 的 数据 是 指 被 命令 更 改 、 但 还 未 被 提交 的 数据 。 在 很 多 情况 下 ， 如 果 允 许 用 户 
对 未 提交 的 数据 进行 存 取 而 数据 最 终 却 未 被 提交 ， 那 么 用 户 据 此 做 出 的 决定 有 可 能 是 错 
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误 的 。 
想象 如 下 场景 : 在 512 航班 上 7C 是 唯一 剩 下 的 座位 。 现 在 Instract 来 到 某 个 航空 代理 
处 想 购 买 512 航班 的 机 票 ， 该 代理 发 现 7C 是 唯一 剩 下 的 座位 ， 于 是 键入 下 列 语句 : 


update reservations set p name="'Instruct' where fl11ght=512 and seat="'7C" 
and p name=NULL;: 

这 时 ，P Read 来 到 男 外 一 个 航空 代理 处 想 购 美 512 航班 的 机 票 ， 访 代理 输入 下 列 合 询 
命令 : 


seleck seat Eromreservat ionsS wwnerenipnanmneanes NU 


如 果 不 阻 止 对 未 提交 数据 的 读 取 ， 那 么 由 于 7C 已 经 被 mstruct 预订 了 ， 所 以 查询 语句 
返回 的 记录 数 为 零 ， 意 味 着 该 航班 已 经 客 满 ，PREAD 就 不 能 买 到 座位 。 

过 了 一 会 儿 ，Instruct 认为 该 航班 太 贵 ， 于 是 ， 该 事务 相应 地 回 滚 ，7C 座位 被 空 出 。 
如 打数 据 库 通过 加 锁 机 制 阻止 对 未 提 区 数据 的 存 取 ，P Read 就 可 以 买 到 7C 座位 。 

DB2 可 以 通过 加 锁 机 制 来 阻止 对 未 提交 数据 的 访问 。 当 然 ， 在 未 些 情况 下 ， 对 未 提交 
数据 的 访问 应 该 是 允许 的 。 


防止 不 可 重复 读 

如 果 相 同 查 询 在 同一 工作 单元 中 返回 不 同 的 结果 集 ， 束 是 出 现 了 人 “不 可 重复 谈 ”。 
图 5-4 中 说 明了 这 种 场景 。 假 设 航空 机 票 代理 1 查找 从 Dallas 到 Honolulu 的 所 有 航班 ， 航 
空 机 票 代理 2 在 flight 表 中 删除 了 一 个 航班 , 因为 这 个 航班 被 取消 了 。 如 果 航 空 机 票 代理 ] 
在 它 的 事务 中 再 次 执行 同样 的 得 询 ， 束 不 会 得 到 完全 相同 的 数据 集 : 其 中 不 包含 取消 的 那 
个 航班 。 因 为 在 航空 机 票 代理 1 运行 其 事务 时 ， 人 允许 航空 机 票 代 理 2 更 改 这 个 表 ， 这 个 玛 
询 将 是 不 可 重复 读 的 。 


DENVER RS 


SAN JOSE 剧 LpENVER 


HONOLULU 天 SAN JOSE 


Book a flight from Dallas to Honolulu 


5-3 不 可 重复 读 
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不 可 重复 谈 是 指 由 于 在 同一 事务 中 ， 两 次 执行 同样 的 SELECT 语句 ， 得 到 的 结果 却 不 
同 。 这 种 情况 会 导致 忌 先 做 出 的 决定 由 于 条 件 的 更 改 而 产生 偶 差 。 
例如 表 5-2 所 示 的 航班 表 : 


| DENVER 
814 | ss | | SANJOSE DENVER 


HONOLULU SAN JOSE 


想象 以 下 场景 : Instruct 需要 从 DALLAS 飞 往 HONOLULU， 他 找到 航空 代理 处 1， 该 
代理 发 现 没 有 直达 航班 ， 但 可 以 从 DALLAS 到 DENVER， 再 到 SAN JOSE， 最 后 到 达 
HONOLULU( 如 表 5-2 所 示 )。Instruct 正在 决定 该 路 线 是 否 可 行 时 , PRead 从 另外 一 个 航空 
代理 处 2 预订 了 814 航班 的 8A 座位 , 而 这 恰好 是 该 航班 的 最 后 一 个 座位 。 如 果 这 时 Instruct 
发 现代 理 提 供 的 路 线 可 行 ， 决 定购 买 时 ， 却 发 现 该 路 线 已 经 不 能 成 立 ，Instruct 就 必须 重新 
选择 路 线 。 

采用 加 锁 机 制 ，DB2 能 够 文 持 可 重复 谈 请 求 ， 可 以 允许 或 阻止 应 用 程序 修改 其 他 应 用 
程序 正在 访问 的 数据 。 对 于 上 述 场 景 而 言 ， 就 是 当 Instruct 在 做 决定 时 ， 人 禁止 航空 代理 处 2 
访问 和 更 改 814 航班 的 8A 座位 信息 ， 因 为 代理 处 1 已 经 加 了 锁 。 


幻像 读 

如 果 应 用 程序 在 事务 中 多 次 执行 同一 SQL 语句 , 而 且 后 续 执 行 会 返回 附加 行 , 就 是 发 
生 了 “ 弥 像 谈 ”。 

图 5-4 中 说 明了 这 种 场景 。 假 设 航空 机 票 代理 1 查询 512 航班 的 所 有 衬 朵 座位， 发 现 
只 有 一 个 座位 宇 看 。 在 此 之 后 ， 由 于 一 位 乘客 取消 了 飞机 票 ， 航 衬 机 票 代 理 2 取消 了 这 个 
航班 上 菏 个 座位 的 了 预订。 如果 代理 1 在 这 个 事务 中 再 次 执行 同一 得 询 ， 那 么 不 会 得 到 与 上 
次 得 询 完 全 相同 的 数据 集 一 因为 出 现 了 新 的 空闲 座位 。 

让 我 们 用 数据 库 来 对 上 述 情况 和 再 进行 一 下 细致 描述 : Istruct 来 到 东航 空 代 理 处 购买 
512 航班 的 机 票 ， 发 出 得 询 命令 后 返回 一 个 空 的 座位 。Instruct 正在 考虑 是 否 需 要 预定 的 时 
候 ，P Read 取消 了 之 前 预定 的 和 $12 号 航班 。 当 Instruct 重新 执行 查询 操作 时 ， 发 现 义 多 出 
了 一 个 空闲 座位。 
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Reservations 


: 2 Update Reservations 
from Re 也 
Ee Set P name = "NULL" 
Where flhight = $512 


ee id Seat = "7A" 
and P Name = "P Read" 


本 Repeat 1 


Dow TA 1s 


now available 


图 5-4 约 像 读 


5.2 锁 的 属性 、 策 略 及 模式 


5.2.1 人 锁 的 属性 


所 有 的 锁 都 具有 下 列 基 本 属性 : 

e 对象; 该 属性 标识 要 锁定 的 数据 资源 。DB2 数据 库 管 理 程序 在 需要 时 锁定 数据 资 
源 ( 如 表 空 间 、 表 和 行 )。DB2 文 持 对 表 空 间 、 表 、 行 和 索引 加 锁 ( 大 型 机 上 的 DB2 
还 文 持 对 数据 页 加 锁 ) 来 你 证 数据 库 的 并 发 完整 性 。 不 过 ， 在 考虑 用 户 应 用 程序 的 
并 发 性 这 一 问题 上 ， 通 第 并 不 检 奏 用 于 表 空 间 和 索引 的 锁 。 分 析 此 美 问 题 的 焦点 
在 于 表 锁 和 行 锁 。 

e 锁定 数 : 该 属性 指定 持 有 锁 的 时 间 长 度 。 事 务 的 隔离 级 别 通 第 控制 看 锁 的 持续 
时 间 。 

e 方式 : 该 属性 指定 允许 锁 的 拥有 者 执行 的 访问 类 型 ， 以 及 允许 并 发 用 户 对 被 锁定 
数据 资源 执行 的 访问 类 型 。 这 个 属性 通常 称 为 贷 沈 式 。 


5.2.2 ”加 锁 策 略 
DB2 可 以 只 对 表 进 行 加 锁 ， 也 可 以 对 表 和 表 中 的 行进 行 加 锁 。 如 果 只 对 表 进 行 加 锁 ， 
那么 表 中 所 有 的 行 都 会 受到 同等 程度 的 影响 。 如 果 加 锁 的 范围 针对 表 及 下 属 的 行 ， 那 么 在 
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对 表 加 锁 后 ， 相 应 的 数据 行 上 还 要 加 锁 。 应 用 程序 究竟 是 对 表 加 行 锁 还 是 同时 加 表 锁 和 行 
锁 ， 是 由 应 用 程序 执行 的 命令 和 系统 的 隔离 级 别 确定 的 。 如 果 某 个 应 用 程序 挂 起 某 个 数据 
库 对 象 上 的 锁定 ， 那 么 另 一 个 应 用 程序 就 可 能 无 法 访问 该 对 象 。 因 此 ， 锁 定 最 少量 数据 并 
使 这 些 数据 不 可 访问 的 行 级 别 锁定 相 比 表 级 别 而 言 ， 对 于 最 大 化 并 行 性 更 好 。 但 是 ， 锁 定 
需要 内 存 和 处 理 时 间 ， 因 此 单个 表 锁定 可 以 最 小 化 锁定 开销 。 


5.2.3 锁 的 模式 


DB2 在 表 一 级 加 锁 可 以 使 用 表 $-3 所 示 的 方式 。 


表 5-3 表 一 级 的 加 锁 方式 


无 意图 (Intent None) 饥 | 

不 裔 要 行 锁 

意 疼 共享 (Intent Share) 蚀 | 

裔 要 行 锁 配合 

意图 排 它 (Intent eXclusive) 锁 


需要 行 锁 配合 
共享 携 意图 排 它 
(Share with Intent 
eXclusive)4i 

南 要 行 锁 配 合 


S 共享 (Share) 锁 
不 需要 行 锦 配合 
U 更 新 (Update) 锁 


不 需要 行 锁 配合 


从 排 它 (eXclusive) 锁 
不 需要 行 锁 配合 


Z 超级 排 它 


(Super Exclusive) 饥 


不 再 要 行 锁 配 合 


描 述 
该 锁 的 拥有 者 可 以 读 表 中 的 任何 数据 ， 包 括 其 他 事务 
尚未 提交 的 数据 ， 但 不 能 对 表 中 的 数据 进行 更 改 
该 锁 的 拥有 者 在 拥有 相应 行 上 的 S 锁 时 可 以 读 取 该 行 
的 数据 ， 但 不 能 对 表 中 的 数据 进行 更 改 
该 锁 的 拥有 者 在 拥有 相应 行 的 X 锁 时 可 以 更 改 该 行 的 
该 锁 的 拥有 者 可 以 读 表 中 的 任何 数据 ， 如 果 在 相应 的 
行 上 能 够 获得 X 锁 ， 那 么 可 以 修改 该 行 。SIX 锁 的 获 
得 比较 特殊 ， 是 在 应 用 程序 已 经 拥有 IX 锁 的 情况 下 请 
求 S 锁 ， 或 是 在 应 用 程序 已 经 拥有 S 锁 的 情况 下 请 求 
IX 饥 时 生成 的 
该 锁 的 拥有 者 可 以 读 表 中 的 任何 数据 , 如 果 表 被 加 上 S$ 
锁 ， 该 表 中 的 数据 就 只 能 被 读 取 ， 不 能 被 改变 
该 锁 的 拥有 者 可 以 读 表 中 的 任何 数据 ， 在 升级 到 X 锁 
之 后 ， 还 可 以 更 改 表 中 的 任何 数据 。 该 锁 是 处 于 等 待 
对 数据 进行 更 改 的 一 种 中 间 状 态 
该 锁 的 拥有 者 可 以 读 取 或 更 改 表 中 的 任何 数据 。 如 果 
对 表 加 上 X 锁 ， 除 了 未 提交 读 程 序 外 ， 其 他 应 用 程序 
都 不 能 对 该 表 进 行 存 取 
该 锁 不 是 通过 应 用 程序 中 的 DML 语言 生成 的 。 一 般 是 
通过 对 表 进 行 删除 (Drop) 和 转换 (Alter) 操 作 或 创建 和 删 
除 索 引 而 获得 的 .如 果 对 表 加 上 Z 锁 , 其 他 应 用 程序 ( 包 
括 未 提交 读 程序 ) 就 不 能 对 该 表 进 行 存 取 
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下 面 对 表 5-3 中 几 种 表 锁 的 模式 作 进 一 步 曾 述 : 
IS、IX、SIX 方式 用 于 表 一 级 并 需要 行 锁 配 合 ， 它 们 可 以 阻止 其 他 应 用 程序 对 该 表 加 


上 排 它 锁 。 
。 如 果 一 个 应 用 程序 获得 某 表 的 IS 锁 ， 该 应 用 程序 可 获得 某 一 行 上 的 S 锁 ， 用 于 只 


读 操 作 ， 同 时 其 他 应 用 程序 也 可 以 读 取 该 行 ， 或 是 对 表 中 的 其 他 行进 行 更 改 。 
如 果 一 个 应 用 程序 获得 革 表 的 I 锁 ,， 该 应 用 程序 可 获得 某 一 行 上 的 和 X 锁 , 用 于 更 
改 操作 ， 同 时 其 他 应 用 程序 可 以 读 取 或 更 改 表 中 的 其 他 行 。 

如 果 一 个 应 用 程序 获得 某 表 的 SIX 锁 ， 该 应 用 程序 可 以 获得 某 一 行 上 的 义 锁 ， 用 
于 更 改 操作 ， 同 时 其 他 应 用 程序 只 能 对 表 中 的 其 他 行进 行 只 读 操 作 。 


S、U、X 和 ZZ 方式 用 于 表 一 级 ， 但 并 不 需要 行 锁 配 合 ， 是 比较 严格 的 表 加 锁 俩 略 。 


如 果 一 个 应 用 程序 得 到 某 表 的 S 锁 ， 该 应 用 程序 可 以 读 表 中 的 任何 数据 ， 同 时 多 
许 其 他 应 用 程序 获得 该 表 上 的 只 读 请 求 锁 。 如 果 有 应 用 程序 需要 更 改 或 读 该 表 中 
的 数据 ， 就 必须 等 S 锁 被 释放 。 

如 果 一 个 应 用 程序 得 到 某 表 的 U 锁 ， 该 应 用 程序 可 以 读 表 中 的 任何 数据 ， 并 最 终 
可 以 通过 获得 表 上 的 X 锁 来 得 到 对 表 中 任何 数据 的 修改 权 。 其 他 应 用 程序 则 只 能 
读 取 该 表 中 的 数据 。U 锁 与 S 锁 的 区 别 主要 在 于 更 改 意 图 上 。U 锁 的 设计 主要 是 
为 了 避免 两 个 应 用 程序 在 拥有 S 锁 的 情况 下 同时 申请 X 锁 而 造成 死 锁 。 

如 果 一 个 应 用 程序 得 到 某 表 上 的 义 锁 , 该 应 用 程序 可 以 读 或 修改 表 中 的 任何 数据 。 
其 他 应 用 程序 不 能 对 该 表 进 行 读 或 更 改 操作 。 

如 果 一 个 应 用 程序 得 到 某 表 上 的 Z 锁 , 该 应 用 程序 可 以 读 或 修改 表 中 的 任何 数据 。 
其 他 应 用 程序 ， 包 括 未 提交 读 程序 都 不 能 对 该 表 进 行 读 或 更 改 操作 。 


s+ EE 
) 土 忆 : 


对 于 IN、IX、IS 和 SIX 这 些 意图 锁 ， 读 者 可 以 这 样 理解 : 严格 来 说 它们 并 不 是 一 种 
举 


锁 ， 而 是 存放 表 中 行 锁 的 信息 。 


个 通俗 的 例子 ， 我 们 去 住 酒店 。 可 以 把 整个 酒店 比喻 成 


一 张 表 ， 每 个 房间 是 一 行 。 那 么 当 我 们 预订 房间 时 ， 就 对 该 行 (房间 ) 加 X 锁 ， 但 是 同时 会 
在 酒店 的 前 台 对 该 行 (房间 ) 做 信息 登记 (旅客 姓名 、 住 多 长 时 间 等 )。 大 家 可 以 把 意图 锁 当 成 
这 个 酒店 的 前 台 ， 它 并 不 是 真正 意义 上 的 锁 ， 它 维护 表 中 每 行 的 加 锁 信 息 ， 是 共用 的 。 后 
续 的 旅客 通过 酒店 前 台 来 看 哪个 房间 是 可 住 的 ， 那 么 ， 如 果 没 有 意图 锁 ， 会 出 现 什么 情况 
呢 ? 假设 我 要 预订 房间 ， 那 么 每 次 我 都 需要 到 每 一 个 房间 查看 以 确认 这 个 房间 有 没有 住 旅 
客 ， 显 然 这 样 做 的 效率 是 很 低下 的 。 其 实 ， 最 时 的 DB2 版 本 是 没有 意图 锁 的 ， 但 是 这 对 并 
发 影响 非常 大 ， 后 来 就 增加 了 意图 锁 。 所 有 的 数据 库 (Oracleg、Informix 和 Sybase) 都 有 意图 
人 锁 的 实现 机 制 。 
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IN 锁 用 于 表 以 允许 未 提交 旋 。 
除了 了 表 锁 之 外 ，DB2 还 支持 表 5-4 所 示 的 几 种 方式 的 行 锁 。 


表 5-4 DB2 支持 的 行 锁 


需要 表 锁 的 
名 称 缩写 全 名 | 描述 
最 低级 别 


该 行 正 被 某 个 应 用 程序 读 取 , 其 他 应 用 程序 只 能 对 
该 行进 行 讯 操作 

某 个 应 用 程序 正在 读 该 行 并 有 可 能 更 改 该 行 , 其 他 
应 用 程序 只 能 读 该 行 

该 行 正 被 某 个 应 用 程序 更 改 , 其 他 应 用 程序 不 能 访 
问 访 行 

当 一 行 数据 被 插入 表 中 的 时 候 ， 该 行 会 被 加 上 W 


ed 


S 共 至 (Share) 灸 


U 条 改 (Update) 僻 


入 排 它 (eXcluslive) 全 1 


绚 排 蕊 
W I 。 饥 的 拥有 者 能 够 更 改 司 行 ， 谱 锁 与 六 锁 基 本 
(Weak eXclusive) 钊 1 
相同 ， 但 它 与 NW 锐 非 容 
F 一 键 北 京 锁 的 拥有 者 和 其 他 程序 都 可 以 读 该 行 , 但 不 能 对 该 
一 键 共享 | 和 
NS : 行进 行 更 改 。 当 应 用 程序 处 于 RS 或 CS 隔离 级 别 
(Next Key Share) 创 | 
时 ， 该 锁 可 用 来 替代 S 锁 
-一 键 排 2 当 一 行 数据 被 插入 索引 中 或 从 索引 中 被 删除 的 时 
2 已 
候 ， 弃 行 的 下 一 行 会 被 加 上 弃 锐 。 鳞 的 拥有 者 可 以 
NX (Next Key 
医 ， 但 不 能 更 改 锁定 行 。 该 锁 与 六 锁 类 似 ， 但 它 
eXcluslive) 介 1 
与 NS 锁 曹 容 
一 键 约 排 它 当 一 行 被 插入 索引 中 的 时 候 , 该 行 的 下 一 行 会 被 加 
NW (Next Key Weak 上 该 锁 。 锁 的 拥有 者 可 以 读 但 不 能 更 改 锁定 行 。 该 


锁 与 X 和 NX 锁 类 似 ， 但 它 与 W 和 NS 锁 兼 容 


eXclusive) 介 1 


5.2.4 如 何 获 取 锁 


大 多 数 情况 下 ，DB2 数据 库 管 理 程序 在 需要 锁 时 会 隐 式 地 获取 它们 ， 因 此 这 些 锁 在 
DB2 数据 库 管 理 程序 的 控制 之 下 。 除 了 使 用 未 提交 读 隔 离 级 别 的 情况 外 ， 事 务 从 不 需要 显 
式 地 请 求 锁 。 事 实 上， 唯一 有 可 能 被 事务 显 式 锁定 的 数据 库 对 象 是 表 (LOCK TABLE)。 
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图 5-5 说 明了 如 何 确定 所 引用 的 对 象 获 取 的 锁 的 其 型 。 


SQL OQperationl 


Index scan Table scan 


Update Intended? Update Intended? 


Acquire Acquire Acquire Acquire 
[ntent Share(IS) Intent exclusive(IX) Share(S) Exclusive(X) 


table=-level lock table-=level lock table-levellock +ahle-levellock 


Acquire Acquire | | N 
Share (S$) Share (S$) or Exclusive (X) / 9 
r 


row-level lock row-level lock ow—level locks 
on all rows on all rows acquired 
referenced referenced 


图 5-5 ”如何 确定 获取 锁 的 类 型 


DB2 数据 库 管 理 程 序 总 是 尝试 获取 行 级 锁 。 但 是 ， 可 以 通过 执行 特殊 形式 的 ALTER 
TABLE 语句 来 修改 这 种 行为 ， 如 下 所 示 : 
ALTER TABLE |[ TableName| LOCKSIZE TABLE 


其 中 的 TableName 标识 现 有 表 的 名 称 ， 所 有 事务 在 访问 它 时 都 要 获取 表 级 锁 。 
也 可 以 通过 执行 LOCK TABLE 语句 ， 强 制 DB2 数据 库 管 理 程序 为 特定 事务 在 表 上 获 
取 表 级 锁 ， 如 下 所 示 : 


LOCK TABLE [TableNamel| IN [SHARE | EXCLUSIVE] MODE 


其 中 的 TableName 标识 现 有 表 的 名 称 ， 对 于 这 个 表 应 该 获取 表 级 锁 ( 假 定 其 他 事 
务 在 该 表 上 没有 不 兼容 的 锁 )。 如 果 在 执行 这 条 语句 时 指定 了 共享 (SHARE) 模 式 ， 吏 会 
狂 得 允许 其 他 事务 谈 取 (但 不 能 更 改 ) 存 储 在 表 中 的 数据 的 表 级 锁 ; 如 果 执 行 时 指定 了 
互 太 (EXCLUSIVE) 模 式 ， 束 会 获得 不 允许 其 他 事务 谈 取 或 修改 存储 在 表 中 的 数据 的 表 
级 锁 。 

ALTER TABLE 语句 的 LOCKSIZE 子 句 指定 行 级 别 或 表 级 别 的 锁定 的 作用 域 (详细 程 
度 )。 默 认 情 况 下 使 用 的 是 行 锁 定 。 由 这 些 已 定义 的 表 锁 定 仅 请 求 S( 共 至) 和 X( 互 斥 ) 锁 定 。 
ALTER TABLE 语句 的 LOCKSIZE ROW 子 句 不 会 阻止 正常 的 锁定 升级 。 
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在 下 列 情况 下 ， 由 ALTER TABLE 语句 定义 的 永久 表 锁 定 可 能 比 使 用 LOCK TABLE 
语句 获得 的 单个 事务 表 锁 定 更 可 取 : 
e 表 是 只 读 的 ， 并 且 始 终 只 需要 $ 锁定 。 其 他 用 户 也 可 以 获取 表 的 $ 锁定 。 
e 表 通 名 由 只 读 应 用 程序 访问 ， 但 有 时 也 需要 单个 用 户 访 问 以 进行 简单 维护 ， 该 用 
户 需要 驴 锁 定 。 当 维护 程序 运行 时 ， 将 只 读 应 用 程序 锁定 在 外 ， 但 在 其 他 情况 下 ， 
只 读 应 用 程序 可 以 在 使 用 最 小 锁定 开销 的 同时 访问 表 。 
ALTER TABLE 语句 在 全 局 指定 锁定 ， 会 影响 访问 该 表 的 所 有 应 用 程序 和 用 户 。 单 个 
应 用 程序 可 以 使 用 LOCK TABLE 语句 来 指定 应 用 程序 级 别 的 表 锁 定 。 


5.2.5 锁 的 兼容 性 


在 一 个 应 用 程序 己 经 对 某 个 对 象 锁定 的 情况 下 ， 另 一 个 应 用 程序 请 求 对 同一 对 象 的 锁 
定 ， 此 时 就 会 出 现 锁定 兼容 性 问题 。 当 两 种 锁定 方式 兼容 时 ， 可 以 同意 对 该 对 象 的 第 二 个 
锁定 请 求 。 如 果 请 求 的 锁定 方式 与 已 挂 起 的 锁定 方式 不 若 容 ， 那 么 束 不 能 同 总 第 二 个 锁定 
请 求 。 相 反 ， 请 求 要 等 到 第 一 个 应 用 程序 释放 锁定 ， 并 且 释 放 所 有 其 他 现 有 的 不 兼容 锁定 
pl 
表 5-$5 和 表 5-6 显示 了 锁 对 象 兼 容 的 有 关 信息 。 在 某 些 状 态 下 ， 当 男 一 个 进程 挂 起 或 
正在 请 求 对 同一 资源 的 锁定 时 ， 可 以 同意 锁定 请 求 。 否 则 请 求 者 就 必须 等 待 ， 直 到 所 有 不 
兼容 的 锁定 被 其 他 进程 释放 为 止 。 
注意 ， 当 请 求 者 正 等 待 锁 定时 ， 可 能 出 现 超时 。 
表 5-5 表 锁 的 兼容 性 
锁 A 的 锁 的 方式 
本 | Z 
IN | 兼容 | 兼容 | 兼容 | 兼容 | 兼容 | 兼容 | 兼容 | 不 兼容 
IS -二 不 兼容 


S 不 兼容 不 兼容 | 不 兼容 
[IX 不 兼容 不 兼容 | 不 兼容 | 不 兼容 | 不 兼容 
SIX | 兼容 兼容 不 兼容 | 不 兼容 | 不 兼容 | 不 兼容 | 不 兼容 | 不 兼容 
U 不 兼容 | 不 兼容 | 不 兼容 | 不 兼容 | 不 兼容 
x 兼容 不 兼容 | 不 兼容 | 不 兼容 | 不 兼容 | 不 兼容 | 不 兼容 | 不 兼容 
z 不 兼容 | 不 兼容 | 不 兼容 | 不 兼容 | 不 兼容 | 不 兼容 | 不 兼容 | 不 兼容 
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表 5-6 行 锁 的 兼容 性 
饭 A 的 锁 B 的 模式 


- 
- 
= 
之 
莹 
三 


不 兼容 “| 不 兼容 | 兼容 | 不 兼容 ”| 不 兼容 
不 兼容 ”| 不 兼容 | 兼容 | 不 兼容 | 不 兼容 


2 
一 


zx|c|" 

半 | 半 | 江 | 洁 | 洁 | 江 | 油 

染 | 潍 | 训 | 染 | 潍 | 吕 | 蝶 |。 
| | 习 乓 


不 兼容 不 
NW -兼容 妆容 


5.3 ”隔离 级 别 (lIsolation Levels) 


客 不 
ri 厚 me 扯 : wa ; 草 

NS 兼容 不 兼容 兼容 
不 
不 


维护 数据 库 的 一 致 性 和 数据 完整 性 ， 同 时 又 允许 多 个 应 用 程序 同时 访问 同一 数据 ， 这 
样 的 特性 称 为 并 发 性 。 DB2 数据 库 用 来 答 试 踢 制 实施 并 发 性 的 方法 之 一 是 通过 使 用 隅 离 级 
列 ， 隔 离 级 别 决 定 在 第 一 个 事务 访问 数据 时 ， 如 何 对 其 他 事务 锁定 或 隔离 该 事务 使 用 的 数 
据 。DB2 使 用 下 列 隔离 级 别 来 强制 实施 并 发 性 : 

e 癌 重 复议 Repeatable Read，RRI) 

e 读 稳 定性 (Read Stability，RS) 
游标 稳定 性 (Cursor Stability，CS) 

e 未 提交 该 (Uncommitted Read，URI) 

可 重复 谈 隅 离 级 别 可 以 防止 所 有 现象 , 但 是 会 大 大 降低 并 发 性 (可 以 同时 访问 同一 资源 
的 事务 数量 )。 未 提交 谈 隅 离 级 别提 供 了 最 大 的 并 友 性 ， 但 是 “ 脏 谈 ”、“ 约 像 谈 ”和 “不 
可 重复 谈 ” 都 可 能 出 现 。 默 认 的 隔离 级 别 是 CS。 


5.3.1 可 重复 读 (RR 一 Repeatable Read) 


可 重复 谈 隅 离 级 别 是 最 严格 的 隅 离 级 别 。 在 该 隔离 级 别 下 ， 事 务 的 影 啊 完 全 与 其 他 
并 发 事务 隔离 ， 脏 谈 、 不 可 重复 谈 、 约 像 谈 现象 奸 不 会 发 生 。 当 使 用 可 重 复 恋 隔离 级 别 
时 ， 在 事务 执行 期 间 会 锁定 该 事务 以 任何 方式 引用 的 所 有 行 。 因此， 如 末 在 同一 事务 中 
发 出 同一 条 SELECT 语句 两 次 或 更 多 次 ， 那 么 产生 的 结 朱 数据 集 总 是 相同 的 。 使 用 可 重 
复 谈 隅 离 级 别 的 事务 可 以 多 次 检索 同一 行 集 ， 并 对 它们 执行 任意 操作 ， 和 直到 提交 或 回 滚 
操作 终止 该 事务 为 止 。 但 是 ， 在 事务 存在 期 间 ， 不 允许 其 他 事务 执行 会 影响 这 个 事务 下 
在 访问 的 任何 行 的 插入 、 更 新 或 删除 操作 。 为 了 确保 这 种 行为 不 会 发 生 ， 锁 定 该 事务 引 
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用 的 每 一 行 一 一 而 不 是 仅 锁 定 和 被 实际 检索 或 修改 的 那些 行 。 因 此 ， 如 果 事 务 扫 拍 了 了 1000 
行 ， 但 只 检索 10 行 ， 那 么 事务 扫描 的 1000 行 (而 不 仅 是 被 检索 的 10 行 ) 都 会 被 锁定 。 

那么 在 现实 环境 中 可 重复 谈 隅 离 级 别 是 如 何 工 作 的 呢 ? 假定 如 家 酒店 使 用 DB2 数据 
库 跟踪 的 客房 信息 ， 包 括 房 间 预 订 和 房价 信息 ， 还 有 一 个 基于 Web 的 应 用 程序 ， 它 允许 顾 
客 按 “ 先 到 先 服 务 ” 的 原则 预订 房间 。 如 果 旅 馆 预 订 应 用 程序 是 在 可 重复 读 陋 离 级 询 下 运 
行 的 ， 当 顾客 扫 摘 某 个 段 日 期 内 的 可 用 房间 列表 时 ， 你 (旅馆 经 理 ) 将 无 法 更 改 那 些 房间 在 
指定 日 期 范围 内 的 房价 。 同 样 ， 其 他 顾客 也 无 法 进行 或 取消 将 会 更 改 该 列表 的 预订 操作 (下 
到 第 一 个 顾客 的 事务 终止 为 止 )。 图 5-6 说 明了 这 种 行为 。 


US r9 
Customer 1 Customer 


会 


Manager 


图 5-6 可 重复 读 隅 离 级 别 的 示例 


在 使 用 可 重复 谈 隅 离 级 别 时 ， 事 务 中 所 有 被 谈 取 过 的 行者 会 被 加 上 $ 锁 ， 直 到 事务 被 
提交 或 回 深 ， 行 上 的 锁 才 会 被 释放 。 这 样 可 以 保证 在 事务 中 即使 多 次 读 取 同一 行 ， 得 到 的 
值 也 不 会 改变 。 为 外 ， 在 同一 事务 中 即使 以 同样 的 搜索 标准 午 新 打开 已 被 处 理 过 的 游标 ， 
得 到 的 结果 集 也 不 会 改变 。 可 香 复 恋 相 对 于 读 稳 定性 而 吾 ， 加 锁 的 范围 更 大 。 对 于 读 稳 害 
性 ， 应 用 程序 只 对 符合 要 求 的 历 有 行 加 锁 ;， 而 对 于 可 重复 谈 ， 应 用 程序 将 对 所 有 衫 扫 朱 过 
的 行 加 锁 。 

可 重复 读 (RR) 会 锁定 应 用 程序 在 工作 单元 中 引用 的 所 有 行 。 利 用 “可 重复 恋 ”， 在 打 
开 游 标的 相同 工作 单元 内 ， 由 应 用 程序 发 出 SELECT 语句 两 次 ， 每 次 都 返回 相同 的 结果 。 
利用 “可 重复 谈 ”， 不 可 能 出 现 丢 失 更 新 、 脏 读 和 维 像 读 的 情况 。 

在 工作 单元 完成 之 恒 ，“ 可 重复 谈 ” 应 用 程序 可 以 尽 可 能 多 次 地 检索 和 操作 这 些 行 。 
但 是 ， 在 工作 单元 完成 之 前 ， 其 他 应 用 程序 均 不 能 更 新 、 删 除 或 插入 可 能 会 影响 结 来 表 的 
行 。“ 可 重复 谈 ” 应 用 程序 不 能 租 看 其 他 应 用 程序 的 未 提交 的 更 改 。 
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5.3.2 ” 读 稳 定性 (RS 一 Read Stability) 


读 稳 定性 隔离 级 别 没 有 可 重复 读 隔 离 级 别 那么 严格 ; 因此， 它 没有 将 事务 与 其 他 并 发 
事务 的 效果 完全 隔离 。 读 稳定 性 隔离 级 别 可 以 防止 脏 读 和 不 可 重复 读 ， 但 是 可 能 出 现 幻像 
谈 。 在 使 用 这 个 隔离 级 唱 时 ， 只 十 锁定 事务 实际 检索 和 修改 的 行 。 因 此 ， 如 采 事 务 扫 拍 了 
1000 行 , 但 只 检索 10 行 , 那么 只 有 被 检索 的 10 行 (而 不 是 所 扫描 的 1000 行 ) 被 锁定 。 因 此 ， 
如 果 在 同一 事务 中 发 出 同一 条 SELECT 语句 两 次 或 更 多 次 ， 那 么 每 次 产生 的 结果 数据 集 可 
能 不 同 。 

与 可 重复 恋 隅 离 级 别 一 样 ， 在 恋 稳 定性 隔离 级 别 下 运行 的 事务 可 以 检索 行 集 ， 并 可 以 
对 筷 们 执行 任意 操作 ， 百 到 事务 终止 。 在 这 个 事务 存在 期 间 ， 其 他 事务 不 能 执行 那些 会 影 
啊 这 个 事务 检索 到 的 行 集 的 更 新 或 删除 操作 ;但 是 其 他 事务 可 以 执行 插入 操作 。 如 果 插 入 
的 行 与 第 一 个 事务 的 得 询 的 选择 条 件 匹 配 ， 那 么 这 些 行 可 能 作为 约 像 出 现在 后 续 产 生 的 结 
琳 数 据 集 中 。 其 他 事务 对 其 他 行 所 做 的 更 改 ， 在 提交 之 前 古 不 可 见 的 。 

那么 ， 读 稳定 性 隅 离 级 别 会 如 何 影响 如 家 酒店 客房 预定 应 用 程序 的 工作 方式 呢 ? 当 一 
个 顾客 检索 茶 段 日 期 内 的 所 有 可 用 房间 列表 时 ， 可 以 更 改 这 个 顾客 的 列表 之 外 的 任何 房间 
的 房价 。 同 样 ， 其 他 顾客 可 以 进行 或 取消 房间 预订 。 如 果 第 一 个 顾客 再 次 运行 同样 的 查询 ， 
其 他 顾客 的 操作 可 能 会 影响 第 一 个 顾客 获得 的 可 用 房间 列表 。 如 果 第 一 个 顾客 再 次 但 询 同 
一 段 日 期 内 的 所 有 可 用 房间 列表 ， 产 生 的 列表 中 有 可 能 包含 新 的 房价 或 第 一 次 产生 列表 时 
不 可 预订 的 房间 。 图 5-7 说 明了 这 种 行为 。 


CUustomer 2 
Customer 1 


I 读 到 的 数 
| 据 加 NS 锁 


三 一 = 下 四 
未 旋 到 的 数 向 
据 不 加 锁 A 


Manager 


图 5-7 读 稳 定性 隔离 级 别 的 示例 
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在 使 用 谈 称 定性 隔离 级 别 时 ， 事 务 中 所 有 被 谈 取 过 的 行 都 会 被 加 上 NS 锁 ， 直 到 事务 


的 信也 不 会 改变 。 但 是 ， 如 条 使 用 这 种 隔离 级 别 ， 那 么 在 事务 中 ， 如 采 使 用 同样 的 搜索 标 
准 重 新 打开 已 被 处 理 过 的 诉 标 ， 结 果 集 可 能 改变 (可 能 会 增加 条 些 行 ， 这 些 行 被 称 为 约 影 行 
(Phantom)。 这 是 因为 RS 隔离 级 别 不 能 阻止 通过 插入 或 更 新 操作 在 结 条 集中 加 入 新 行 )。 

谈 稳 定性 (RS) 只 锁定 应 用 程序 在 工作 单元 中 检索 的 那些 行 , 确保 在 工作 单元 完成 之 前 ， 
在 工作 单元 运行 期 间 的 任何 限定 行 谈 取 不 被 其 他 应 用 程序 进程 更 改 ， 并 且 确 保 不 会 谈 取 由 
男 一 个 应 用 程序 进程 更 改 的 任何 行 ， 和 直人 到 该 进程 沙 实 了 这 些 更 改 为 止 。 也 就 是 说 ， 不 可 能 
出 现 “ 不 可 重复 读 ” 的 情形 。 

“ 庄 稳 定性 ” 隐 离 级 别 的 目标 之 一 是 提供 较 局 并 行 性 以 及 数据 的 稳定 视图 。 为 了 有 助 
于 达到 此 目标 ， 优 化 项 确保 在 发 生 锁 定 升 级 前 不 获取 表 级 锁定 。 

“ 谈 稳 定性 ”隔离 级 别 最 适用 于 包括 下 列 所 有 特征 的 应 用 程序 : 

。 在 并 发 环境 下 运行 

。 必须 限定 某 些 行 在 工作 单元 运行 期 间 保持 稳定 

e 在 工作 单元 中 不 会 多 次 发 出 相同 的 得 询 ， 或 者 在 同一 工作 单元 中 发 出 多 次 得 询 上 

并 不 和 要求 得 询 获 得 相同 的 回答 


5.3.3 游标 稳定 性 (CS 一 Cursor Stability) 


游标 稳定 性 隔离 级 别 在 隔离 事务 效果 方面 非常 宽松 ， 可 以 防止 脏 读 ， 但 有 可 能 出 现 不 
可 重复 读 和 幻像 读 。 这 是 因为 在 大 多 数 情况 下 ， 游 标 稳定 性 隔离 级 别 只 锁 定 由 事务 声明 并 
打开 的 游标 当前 引用 的 行 。 

当 使 用 游标 稳定 性 隔离 级 别 的 事务 通过 游标 从 表 中 检索 行 时 ， 其 他 事务 不 能 更 新 或 机 
除 游标 引用 的 行 。 但 是 ， 如 果 被 锁定 的 行 本 身 不 是 用 索引 访问 的 ， 那 么 其 他 事务 可 以 将 新 
的 行 添加 到 表 中 , 以 及 对 被 锁定 行 前 后 的 行进 行 更 新 和 /或 删除 操作 。 所 获取 的 锁 一 直 有 效 ， 
直到 游标 重 定位 或 事务 终止 为 止 (如 果 游 标 重 定位 ， 原 来 行 上 的 锁 就 被 释放 ， 并 获得 游标 现 
在 所 引用 行 上 的 锁 )。 此 外 ， 如 果 事务 修改 检索 到 的 任何 行 ， 那 么 在 事务 终止 之 前 ， 其 他 事 
务 不 能 更 新 或 删除 该 行 ， 即 使 游标 不 再 位 于 被 修改 的 行 。 与 可 重复 读 和 读 稳定 性 隔离 级 别 
一 样 ， 其 他 事务 在 其 他 行 上 进行 的 更 改 ， 在 这 些 更 改 提交 之 前 对 于 使 用 游标 稳定 性 隔离 级 
别 (这 是 默认 的 隔离 级 别 ) 的 事务 是 不 可 见 的 。 

如 果 如 家 酒店 的 客房 预订 应 用 程序 在 游标 稳定 性 隔离 级 别 下 运行 ， 那 么 会 有 什么 影响 
呢 ? 当 顾客 检索 某 段 日 期 内 所 有 可 用 房间 的 列表 ， 然 后 查看 产生 的 列表 中 每 个 房间 的 信息 
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时 (每 次 丛 看 一 个 房间 )， 可 以 更 改 旅 第 中 任何 房间 的 房价 ， 但 是 顾客 当前 正在 得 看 的 房间 
除外 (对 于 指定 的 日 期 泡 围 )。 同 样 ， 其 他 顾客 可 以 对 任何 房 则 进行 或 取消 预订 ,但 古 第 一 
个 顾客 当前 正在 租 看 的 房间 除外 (对 于 指定 的 日 期 犯 围 )。 也 束 是 说 ， 对 于 第 一 个 顾客 当前 
正在 丛 看 的 房间 记录 ， 你 和 其 他 顾客 都 不 能 进行 任何 操作 。 当 第 一 个 顾客 丛 看 列表 中 态 一 
个 房间 的 信息 时 , 你 和 其 他 顾客 惑 可 以 修改 他 刚才 但 看 的 房间 记录 (如 末 这 个 顾客 没有 预订 
这 个 房间 的 话 )。 图 5-8 说 明了 这 种 行为 。 
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图 5-8 ”游标 稳定 性 隔离 级 别 的 示例 


在 使 用 放 标 稳定 性 隔离 级 别 时 , 事务 的 结 朱 集中 只 有 正在 被 谈 取 的 那 一 行 ( 诉 标 指 回 的 
行 ) 会 被 加 上 NS 锁 ， 其 他 未 被 处 理 的 行 不 被 加 锁 。 这 种 隅 离 级 别 上 只 能 保证 正在 和 被 处 理 的 行 
的 值 不 会 被 其 他 并 友 的 程序 所 改变 。 该 隔离 级 别 是 DB2 默认 的 隔离 级 别 。 

当 在 行 上 定位 游标 时 ， 游 标 稳定 性 (CS) 会 锁定 任何 由 应 用 程序 的 事务 访问 的 行 。 此 锁 
定 在 谈 取 下 一 行 或 终止 事务 之 前 有 效 。 但 是 ， 如 朱 蝎 改 东 一 行 上 的 任何 数据 ， 那 么 在 对 数 
据 库 洛 实 更 改 之 前 必须 挂 起 该 锁定 。 

对 于 具有 “ 洲 标 稳定 性 ”的 应 用 程序 已 检索 的 行 ， 当 该 行 上 有 任何 可 更 新 的 游标 时 ， 
任何 其 他 应 用 程序 都 不 能 更 新 或 删除 该 行 。“ 话 标 稳定 性 ”应 用 程序 不 能 租 看 其 他 应 用 程 
序 的 未 洛 实 更 改 。 

使 用 “ 洲 标 稳定 性 ” 隐 离 级 别 ， 可 能 会 出 现 不 可 重复 读 和 幻像 读 现 象 。“ 游 标 稳定 性 ”是 
套 认 隔离 级 列 ， 建 议 在 需要 最 大 并 行 性 、 但 只 看 到 其 他 应 用 程序 中 已 洛 实行 的 情况 下 才 使 用 。 
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5.3.4 当前 已 提交 (Currently Committed) 


但 是 在 CS 隔离 级 别 下 ， 在 查询 过 程 中 ，DB2 会 对 游标 所 在 的 行 加 NS 锁 。 如 果 该 行 
目前 正在 被 修改 ， 那 么 也 会 堵塞 查询 。 随 着 互联 网 的 不 断 发 展 ， 基 于 Intemet 的 非 账 务 类 
应 用 往往 具有 大 并 发 、 高 啊 应 的 特点 。 对 于 这 些 应 用 ， 频 繁 的 锁 等 待 是 无 法 容忍 的 ， 因 此 
在 DB2 V9.7 的 CS 隔离 级 别 里 ， 新 增 了 名 为 当前 已 提交 (Currently Committed) 的 数据 库 配 
置 选项 。 在 默认 当前 已 提交 启用 的 情况 下 ，DB2 在 查询 的 时 候 不 会 再 被 修改 的 行 阻 塞 ， 如 
果 发 现 未 提交 的 变化 行 数据 ， 那 么 将 使 用 当前 已 提交 的 数据 。 此 行为 基于 日 志 ， 不 需要 额 
外 的 维护 操作 ， 可 以 有 效 避 免 超 时 和 死 锁 现象 。 

可 以 通过 修改 db cfg 来 局 动 或 天 闭 当 前 提交 : 


sdb2 update db cfg for test UsIng CUur Commit on 
DB20000I The UPDATE DATABASE CONFIGURATION command completed successfully. 


比如 在 上 面 的 酒店 预订 例子 中 ， 如 果 第 一 个 顾客 正在 预订 某 个 房间 ， 在 不 使 用 当前 已 
提交 的 情况 下 ， 其 他 顾客 需要 等 待 第 一 个 顾客 预订 完 才能 读 取 该 房间 的 信息 ;但 是 如 果 启 
用 当前 已 提交 ， 那 么 其 他 顾客 在 查询 该 房间 的 时 候 不 需要 等 待 ， 但 是 查询 到 的 信息 仍然 是 
未 修改 前 的 信息 。 


5.3.5 未 提 区 读 (UR 一 Uncommitted Read) 


未 提交 读 隔 离 级 别 是 最 不 严格 的 隔离 级 别 。 实 际 上 ， 在 使 用 这 种 隔离 级 别 时 ， 仅 当 另 
一 个 事务 试图 删除 或 更 改 被 检索 的 行 所 在 的 表 时 ， 才 会 锁定 被 检索 的 行 。 因 为 在 使 用 这 种 
隔离 级 别 时 ， 行 通常 保持 未 锁定 状态 ， 所 以 脏 恋 、 不 可 重复 谈 和 幻像 恋 都 可 能 会 友 生 。 因 
此 ， 未 提交 读 隔 离 级 别 通 常用 于 那些 访问 只 读 表 和 视图 的 事务 ， 以 及 某 些 执行 SELECT 语 
名 的 事务 (只 要 其 他 事务 的 未 提交 数据 对 这 些 语 句 没 有 负面 效果 )。 

顾名思义 ， 其 他 事务 对 行 所 做 的 更 改 在 被 提交 之 前 对 于 使 用 未 提交 读 隔 离 级 别 的 事务 
是 可 见 的 。 但 是 ， 此 类 事务 不 能 看 见 或 访问 其 他 事务 创建 的 表 、 视 图 或 索引 ， 直 到 那些 事 
务 被 提交 为 止 。 类 似 地 ， 如 果 其 他 事务 删除 了 现 有 的 表 、 视 图 或 索引 ， 那 么 仅 当 进行 删除 
操作 的 事务 终止 时 , 使 用 未 提交 读 隔 离 级 别 的 事务 才能 知道 这 些 对 象 不 青 存在 了 (一 定 要 注 
意 : 当 运 行 在 未 提交 读 隔 离 级 别 下 的 事务 使 用 可 更 新 游标 时 ， 该 事务 的 行为 和 在 游标 稳定 
性 隔离 级 别 下 运行 一 样 ， 并 应 用 游标 稳定 性 隔离 级 别 的 约束 )。 

那么 未 提交 读 隔 离 级 别 对 如 家 酒店 的 客房 预订 应 用 程序 有 什么 影响 呢 ?” 现 在 ， 当 顾客 
检索 某 段 日 期 内 的 所 有 可 用 房间 列表 时 ， 你 可 以 更 改 旅馆 中 任何 房间 在 任何 日 期 的 房价 ， 
而 其 他 顾客 也 可 以 对 任何 房间 进行 或 取消 预订 ， 包 括 第 一 个 顾客 当前 正在 查看 的 房间 记录 
(对 于 指定 的 日 期 范围 )。 另 外 ， 第 一 个 顾客 生成 的 房间 列表 可 能 包含 其 他 顾客 正在 预订 ( 因 
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此 实际 上 不 可 用 ) 的 房间 。 图 5-9 说 明了 这 种 行为 。 


Customer 2 


Customer 1 


‘D -A 
eslllt Set Table 


a 


Manager 
图 5-9 未 提交 读 隔 离 级 别 的 示例 
未 提交 读 (UR) 允 许 应 用 程序 访问 其 他 事务 的 未 提交 更 改 。 除 非 其 他 应 用 程序 尝试 删除 


或 改变 该 表 ， 人 否则 该 应 用 程序 不 会 锁定 正 谈 取 的 行 而 使 其 他 应 用 程序 不 能 访问 该 行 。 对 于 
只 读 和 可 更 新 的 游标 ，“ 未 提交 读 ” 的 工作 方式 有 所 不 同 。 

在 使 用 未 提交 恋 隅 离 级 别 时 , 对 于 只 谈 操 作 , 不 加 行 锁 。 典型 的 只 读 操 作 包 括 SELECT 
语句 的 结果 集 ( 比 如 语句 中 包括 ORDER BY 子 句 )、 定 义 游标 时 指明 FOR FETCH ONLY。 

未 捉 交 斌 隅 离 级 别 可 以 改善 应 用 程序 的 性 能 ， 同 时 可 以 最 大 程度 地 允许 并 发 。 但 是 ， 
应 用 程序 的 数据 完整 性 将 受到 威胁 。 如 果 需 要 读 取 未 提 区 的 数据 ,该 隔离 级 别 是 唯一 选择 。 

只 读 游 标 可 以 访问 大 多 数 其 他 事务 未 党 实 的 更 改 。 但 是 ， 当 该 事务 正在 处 理 时 ， 不 能 
使 用 正 由 其 他 事务 创建 或 删除 的 表 、 视 图 和 索引 。 其 他 事务 的 任何 其 他 更 改 在 落实 或 回 滚 
前 都 可 被 谈 取 。 


注意 : 
“未 提交 读 ” 隔 离 级 别 下 的 可 更 新 操作 的 游标 的 工作 方式 与 游标 稳定 性 隔离 级 别 下 的 
相同 。 


当 使 用 隔离 级 别 UR 运行 程序 时 ,应 用 程序 可 以 使 用 隔离 级 别 CS。 发 生 这 种 情况 的 原 
因 是 应 用 程序 中 使 用 的 游标 是 模糊 游标 。 利 用 BLOCKING 选项 ， 可 以 将 模糊 游标 升级 为 
隔离 级 别 CS。BLOCKING 选项 的 默认 值 是 UNAMBIG。 这 意味 着 模糊 游标 是 可 更 新 的 ， 
并 且 隔 离 级 别 可 以 升级 为 CS。 要 防止 此 升级 ， 有 两 种 选择 : 
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e ”修改 应 用 程序 中 的 游标 为 非 模糊 游标 。 将 SELECT 语句 更 改 为 包括 FOR READ 
ONLY 子 人 句 。 
e 将 模糊 游标 保留 在 应 用 程序 中 ,但 是 使 用 预 编译 程序 或 BLOCKING ALL 和 
STATICREADONLY YES 选项 绑 定 它 ， 以 允许 在 运行 应 用 程序 时 将 任何 模糊 游标 
视 为 上 只 读 游 标 。 
同 对 扫描 1000 行 的 “可 重复 读 ” 给 出 的 示例 一 样 ， 如 果 使 用 “未 提交 读 ”， 那 么 不 
南 要 任何 行 锁 定 。 
使 用 “未 提交 读 ”， 可 能 出 现 不 可 重复 读 和 幻像 读 现 象 。“ 未 提交 读 ” 隔 离 级 别 最 党 
用 于 只 读 表 上 的 查询 。 如 果 仅 执行 选择 语句 且 不 关心 是 否 可 从 其 他 应 用 程序 中 看 到 未 提交 
的 数据 ， 那 么 该 隔离 级 别 也 是 不 错 的 选择 。 
以 上 所 讲 的 隔离 级 别 的 加 锁 范 围 和 持续 时 间 都 是 针对 读 操 作 而 言 的 。 对 于 更 改 操作 ， 
被 修改 的 行 会 被 加 上 X 锁 ， 无 论 使 用 何 种 隔离 级 别 ，X 锁 都 直到 提交 或 回 滚 之 后 才 会 被 
释放 。 


5.3.6 ”隔离 级 别 的 摘要 
表 5-7 按 不 期 望 的 结果 概述 了 几 个 不 同 的 隔离 级 别 。 
表 5-7 隔离 级 别 的 摘要 


隅 亢 级 别 访问 未 党 实 的 数据 不 可 重复 读 


幻 像 读 


可 日 复读 (RR) 不 可 能 
证 稳定 性 (RS) 可 能 
游标 稳定 性 (CS) 可 能 
未 提交 读 (UR) 可 能 


表 5-8 提供 了 简单 的 试探 方法 ， 以 帮助 你 为 应 用 程序 选择 初始 隔离 级 别 。 首 先 考虑 
表 5-8 中 所 示 的 方法 ， 并 参阅 先前 对 各 隔离 级 别 的 讨论 ， 以 找到 最 适合 的 隔离 级 别 。 


表 5-8 ”选择 阳 珊 级 别 的 准则 


应 用 程序 类 型 珊 要 高 数据 稳定 性 不 需要 高 数据 稳定 性 
严 写 事务 CS 
只 证 事务 UR 
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为 应 用 程序 选择 适当 的 隔离 级 别 对 于 应 用 程序 避免 无 法 容忍 的 现象 很 重要 。 因 为 获取 
和 释放 锁定 所 需 的 CPU 和 内 存 资源 会 随 隔离 级 别 的 不 同 而 不 同 , 所 以 隔离 级 别 不 但 影响 应 
用 程序 之 间 的 隔离 程度 ， 而 且 还 影响 应 用 程序 的 性 能 特征 。 洪 在 的 锁 等 待 情况 也 会 随 隔离 
级 别 的 不 同 而 不 同 。 

因为 隔离 级 别 确定 访问 数据 时 如 何 锁定 数据 并 使 数据 不 受 其 他 进程 影响 ， 所 以 应 该 选择 
能 平衡 并 行 性 和 数据 完整 性 需求 的 隔离 级 别 。 指 定 的 隔离 级 别 在 工作 单元 运行 期 间 生效 . 


1. 选择 正确 的 隔离 级 别 


使 用 的 隔离 级 别 不 仅 影 啊 数据 库 对 并 发 性 的 文 持 程度 ， 而 且 影 啊 并 有 应 用 程序 的 性 
能 。 通 党 ， 使 用 的 隔离 级 别 越 严 格 ， 并 发 性 束 越 小 ， 东 些 应 用 程序 的 性 能 还 可 能 会 越 低 ， 
因为 它们 要 等 每 资源 上 的 锁 补 释放。 那么 ， 如 何 决 定 要 使 用 哪 种 隔离 级 别 呢 ?最 好 的 方法 
是 确定 哪些 现象 是 不 可 接受 的 ， 然 后 选择 能 够 防止 这 些 现象 发 生 的 隔离 级 别 : 

e 如 条 正在 执行 大 型 得 询 ， 而 且 不 希望 并 发 事务 所 做 的 修改 会 导致 租 询 的 多 次 运行 

而 返回 不 同 的 结果 ， 那 么 使 用 可 重复 读 隔 离 级别 。 

e 如果 希望 在 应 用 程序 之 间 获 得 一 定 的 并 发 性 ， 并 且 希 望 限定 的 行 在 事务 执行 期 间 

保持 稳定 ， 那 么 使 用 旋 稳 定性 隔离 级 别 。 

e 如 果 希 望 获得 最 大 的 并 发 性 ， 同 时 不 希望 查询 看 到 未 提交 的 数据 ， 那 么 使 用 游标 
稳定 性 隔离 级 别 。 

如 果 正 在 只 斌 的 表 / 视 图 /数据 库 上 执行 查询 ,或 者 并 不 介 蕊 查询 是 盏 返回 未 提交 的 

数据 ， 那 么 使 用 未 提交 读 隔 离 级 别 。 

2. 指定 要 使 用 的 隔离 级 别 

尽管 隔离 级 别 控制 事务 级 的 行为 ， 但 实际 上 是 在 应 用 程序 级 被 指定 的 ; 

e 对 十 风 入 式 SQL 应 用 程序 , 在 预 编 译 时 或 在 将 应 用 程序 绑 定 到 数据 库 ( 如 末 使 用 延 

迟 绑 定 ) 时 指定 隔离 级 别 。 在 这 种 情况 下 ， 使 用 PRECOMPILE 或 BIND 命令 的 

ISOLATION 选项 来 设置 隅 离 级 别 。 

对 于 开放 数据 库 连 接 (Open Database Connectivity，ODBC) 和 调用 级 接口 (Call Level 

Interface ，CLD 应 用 程序 ， 隔 离 级 别 是 在 应 用 程序 运行 时 通过 调用 指定 了 

SQL ATTR TXN ISOLATION 连接 属性 SQLSetConnectAttr0 国 数 进行 设置 的 ( 另 

外 ， 也 可 以 通过 指定 db2cliini 配置 文件 中 TXNISOLATION 关键 子 的 值 来 设 站 

ODBC/CLI 应 用 程序 的 隔离 级 别 。 但 是 ， 这 种 方法 不 够 灵活 ,不 能 像 第 一 种 方法 屠 

样 为 应 用 程序 中 的 不 同事 务 修改 隔离 级 别 )。 

e 对 于 Java 数据 库 连 接 (Java Database Connectivity，JDBC) 和 SQLJ 应 用 程序 , 隔离 级 别 
是 在 应 用 程序 运行 时 通过 调用 DB2 的 java.sql 连接 接口 中 的 setTransactionIsolation() 
方法 设置 的 。 
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当 没 有 使 用 这 些 方法 显 式 指定 应 用 程序 的 隔离 级 别 时 ， 默 认 使 用 洲 标 稳定 性 隔离 级 
别 。 这 个 默认 设置 适用 于 从 命令 行 处 理 程序 (CLP) 执 行 的 DB2 命令 、SQL 语句 和 脚本 ， 以 
及 先入 式 SQL、ODBC/CLI、JDBC 和 SQLJ 应 用 程序 。 因 此 ， 也 可 以 为 从 CLP 执行 的 操 
作 (以 及 传递 给 DB2 CLP 进行 处 理 的 脚本 ) 指 定 隔 离 级 别 。 在 这 种 情况 下 ， 隔 离 级 别 是 通过 
在 建立 数据 库 连 接 之 前 在 CLP 中 执行 CHANGE ISOLATION 命令 设置 的 : 

sdb2 change lsolation to ur 

DB21027E 当 连 接 人 至 数据 库 时 未 能 更 改 隔离 级 别 

sdb2 connect reset 

DB20000I SOL 命令 成 功 完 成 

sdb2 change lisolation to ur 

DB21053W ” 当 连 接 至 不 支持 UR 的 数据 库 时 ， 会 发 生日 动 升级 

DB20000I CHANGE ISOLATION 命令 成 功 完成 

在 DB2UDB 7.1 及 更 高 版 本 中 , 能 够 指定 特定 但 询 所 用 的 隅 离 级 别 , 方法 是 在 SELECT SQL 
语句 中 加 上 WITH [RR1RS1CS 1UR] 子 负 。 使 用 这 个 子 句 的 简单 SELECT 语句 示例 如 下 所 示 : 


SELECT * FROM EMPLOYEE WHERE EMPID = “001" WITH RR 


如 果 应 用 程序 在 大 多 数 时 候 需 要 比较 宽松 的 隔离 级 别 ( 以 支持 最 大 的 并 发 性 )， 但 是 对 
于 其 中 的 某 些 查 询 必须 防止 某 些 现象 出 现 ， 那 么 这 条 子 句 就 是 帮助 你 实现 目标 的 好 方法 。 


5.4 ” 锁 转 换 、 锁 等 待 、 锁 升级 和 死 锁 


5.4.1 锁 转 换 及 调整 条 例 


更 改 已 挂 起 的 锁定 方式 被 称 为 转换 。 当 进程 访问 已 挂 起 锁定 的 数据 对 象 ， 且 访问 方式 
需要 比 已 挂 起 的 锁定 更 严格 时 ， 数 据 库 管理 器 将 数据 对 象 上 现 有 的 锁 模 式 与 被 请 求 的 锁 模 
式 进 行 比较 ， 如 果 和 需要 的 锁 模式 更 高 ， 将 进行 锁 转换 。 进 程 在 任意 时 间 对 数据 对 象 只 能 挂 
起 锁定 ， 尽 管 可 以 通过 碍 询 间 接地 对 同一 数据 对 象 多 次 请 求 锁定 。 在 事务 中 ， 当 对 象 需要 
不 同 的 加 锁 模 式 时 ， 为 对 象 加 上 更 高 模式 的 锁 ， 和 否则 将 保持 现 有 的 锁 模 式 。 锁 模式 由 高 到 
低 按照 以 下 顺序 排列 : 

表 锁 : IN3>IS>S>IX>U>X->Z 

行 锁 :SUX 

其 中 S 锁 与 其 锁 的 转换 比较 特殊 ， 当 应 用 程序 拥有 表 上 的 $S 锁 并 请 求 I[X 锁 的 时 候 ， 
锁 转 换 的 结果 为 SIX 锁 。 或 者 ， 当 应 用 程序 拥有 表 上 的 IX 锁 并 请 求 $ 锁 的 时 候 ， 锁 转换 
的 结果 也 是 SIX 锁 。 
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某 些 锁定 方式 仅 适 用 于 表 ， 而 有 些 锁定 方式 仅 适 用 于 行 。 对 于 行 ， 如 果 需 要 X 锁 且 挂 
起 S 或 U( 更 新 ) 饥 ， 那 么 进行 转换 。 

但 是 ， 在 锁定 转换 这 一 点 上 ， 芭 ( 意 问 互 矿 ) 和 S( 共 享 ) 锁 是 特殊 情况 。S 和 IX 锁定 的 
严格 程度 相当 ， 所 以 如 果 挂 起 了 一 个 而 请 求 男 一 个 ， 那 么 结果 转换 为 SIX( 市 意 癌 互 斥 的 共 
7 如 果 请 求 的 方式 更 严格 ,那么 所 有 其 他 的 转换 都 将 导致 请 求 的 锁定 方式 变 成 挂 起 

的 锁定 方式 。 

当 奏 询 更 新 行 时 ， 也 可 以 发 生 双 重 转 换 。 如 果 行 是 通过 索引 访问 读 取 的 且 锁 定 为 $， 
那么 包含 该 行 的 表 具 有 和 窗 盖 意 问 锁定。 但 是 ， 如 果 锁 定 类 型 是 IS 而 不 是 人 ， 并 且 随 后 更 
改 了 行 ， 那 么 表 锁 定 将 转换 为 IX， 而 行 锁定 转换 为 X。 


注意 : 

在 执行 SQL 时， 锁定 转换 通常 隐 式 地 进行 ， 由 数据 库 自 动 完成 而 不 需要 用 户 参 与 。 了 
解 不 同 的 查询 以 及 表 和 索引 的 组 合 能 获得 的 锁定 种 类 ， 有 助 于 设计 和 调整 应 用 程序 ， 

表 5-9 是 一 个 锁 转换 的 例子 , 这 里 假设 当前 应 用 程序 的 隅 离 级 别 为 RR，IXCOL= ?谓词 
采用 的 扫 摘 方式 为 索引 扫 摘 。 


表 5-9 锁 转 换 示 例 
说 明 


SELECT ... FROM A 该 事务 中 的 第 一 条 语句 , 不 
WHERE IXCOL=? 会 发 生 锁 转换 


s 锁 的 模式 比 IS 锁 高 , 需要 
SELECT ... FROM A S 的 模式 尖 高 , 需要 
饥 转 换 


SELECT ... FROM A IS 锁 的 模式 比 S$ 锁 低 , 所 以 
WHERE IXCOL=? 不 需要 人 锁 转 换 

UPDATE A 原先 是 S 锦 , 现 在 义 申 请 区 
WHERE IXCOL=? 筑 , 完 转换 的 结果 为 SIX 负 
COMMIT 不 需要 锁 要 所 有 锁 被 释放 | 在 提交 时 锁 被 释放 


人 不 需要 浙 事务 的 开始 
LOCK TABLE A IN i X 锁 的 模式 比 IS 锁 高 ， 需 
EXCLUSIVE MODE 要 进行 锁 转 换 
UPDATE A SET.. x 不 二 要 IX 锁 的 模式 比 和 锁 低 ， 不 
WHERE IXCOL=? 青 要 饥 转 换 

硼 要 鲁 \ 备 要 1 有 人 锁 补 释放 


ROLLBACK 在 回 深 时 锁 被 释放 
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注意 : 
所 有 的 人 锁 在 提交 或 回 深 时 都 会 被 释放 ， 除 了 定义 游标 时 与 指定 为 WITH HOLD 的 游标 
相关 的 表 倘 。 


5.4.2 ” 锁 升 级 及 调整 笋 例 


数据 库 管 理 需 可 以 目 动 将 锁定 从 行 级 别 升级 为 表 级 别 。 对 于 分 区 表 ， 数 据 库 管理 需 可 
以 目 动 将 锁定 从 行 或 块 级 别 升级 为 数据 分 区 级 别 。maxlocks 数据 库 配 置 人 参数 用 于 指定 触发 
锁定 升级 的 百分比 。 获 取 触 发 锁定 升级 的 锁定 的 表 可 能 不 受 影响 。 每 个 锁 在 内 存 中 都 需要 
一 定 的 内 存 空 间 ， 为 了 减少 锁 需 要 的 内 存 开销 ，DB2 提供 了 锁 升 级 这 一 功能 。 锁 升级 是 通 
过 对 表 加 上 非 意 岁 性 的 表 锁 ， 同 时 释放 行 锁 来 减少 锁 的 数目 ， 从 而 达到 减少 锁 需 要 的 内 存 
开销 的 目的 。 锁 升级 由 数据 库 管 理 堪 目 动 完 成 ， 数 据 库 的 配置 参数 锁 列 表 页 面 数 (locklisb 
和 应 用 程序 占有 日 分 比 (mnaxlocks) 直 接 影 啊 锁 升级 的 处 理 ， 如 图 5-10 所 示 。 

在 图 5-10 中 ， 上 图 说 明 应 用 程序 超出 允许 它 上 共有 的 总 的 锁 内 存 百 分 比 (maxlocks 值 ) 的 情 
况 。 因 此 ， 数 据 库 执行 锁 升 级 ， 将 应 用 程序 的 锁 内 存 百 分 比 降低 到 maxlocks 指定 的 百 分 
比 之 下 。 下 图 说 明了 更 为 弟 见 的 情况 一 一 到 达 总 的 锁 内 存 限制 ,因此 执行 锁 升 级 来 释放 锁 
内 存 。 


locklist 


maxlocks 


EscalatingApplication Other Applications 


图 5-10” 锁 升级 示意 图 
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锁 升 级 问题 可 以 通过 增加 locklist 和 maxlocks 数据 库 参 数 的 大 小 来 解决 。 人 但是， 如果 
仍然 遇 到 锁定 问题 ， 应 检 奏 是 否 因 未 能 提交 事务 而 未 释放 已 更 新 行 上 的 锁 。 
每 个 数据 库 都 有 锁 列 表 ， 锁 列表 包含 所 有 同时 连接 到 数据 库 的 应 用 程序 所 持 有 的 锁 。 
在 DB2 V9.7 64 位 平台 上 ， 第 一 个 锁 要 求 占 256 字 节 ， 而 其 他 锁 要 求 占 128 学 节 。 
当 应 用 程序 使 用 的 locklist 的 百分比 达到 maxlocks 时 ， 数 据 库 管理 器 将 执行 一 次 锁 升 
级 (lock escalation)， 在 这 个 操作 中 会 将 行 锁 转 换 成 单独 的 表 锁 。 而 且 ， 如 末 locklist 快要 耗 
尽 ， 数 据 库 管理 器 将 找 出 挂 有 表 上 最 多 行 锁 的 连接 ， 并 将 这 些 行 锁 转换 成 表 锁 以 释放 
locklist 内 存 。 锁 定 整 个 表 会 大 大 降低 并 发 性 ， 锁 等 竺 或 锁 超 时 的 几率 也 如 增 加 了 。 
e locklist 表明 分 配给 锁 列 表 的 存储 容量 。 每 个 数据 库 都 有 锁 列 表 ， 锁 列表 包含 了 并 
发 连接 到 数据 库 的 所 有 应 用 程序 所 持 有 的 锁 。 锁 定 是 数据 库 管 理 器 用 来 控制 多 个 
应 用 程序 并 发 访问 数据 库 中 数据 的 机 制 。 行 和 表 都 可 以 被 锁定 。 
e maxlocks 定义 了 应 用 程序 持 有 的 锁 列 表 的 百分比 ， 在 数据 库 管理 器 执行 锁 升 级 之 
前 必须 填充 锁 列 表 。 当 应 用 程序 使 用 的 锁 列 表 百 分 比 达 到 maxlocks 时 ， 数 据 库 管 
理 需 会 升级 这 些 锁 ， 这 意味 看 用 表 锁 代 登 行 锁 ， 从 而 减少 列表 中 锁 的 数量 。 当 任 
何 应 用 程序 持 有 的 锁 数 量 达 到 整个 锁 列 表 大 小 的 这 个 百分比 时 ， 对 应 用 程序 持 有 
的 锁 进 行 锁 升 级 。 如 果 锁 列表 用 完了 空间 ， 那 么 也 会 发 生 锁 升 级 。 数 据 库 管 理 器 
通过 查看 应 用 程序 的 锁 列表 并 查找 行 锁 最 多 的 表 ， 决 定 对 哪些 锁 进 行 升级 。 如 果 用 
表 锁 替换 这 些 行 锁 ， 将 不 再 会 超出 maxlocks 值 ， 那 么 锁 升 级 就 会 停止 。 和 否则 ， 锁 升 
级 就 会 一 直 进 行 ， 直 到 持 有 的 锁 列 表白 分 比 低 于 maxlocks。maxlocks 参数 乘 以 
maxappls 参数 的 值 不 能 小 于 100。 
locklist 配置 参数 的 计算 方法 如 下 (操作 系统 为 DB2 V9.7 64 位 平台 ): 
(1) 计算 锁 列 表 大 小 的 下 限 : (512 * 128 *maxappls)/4096。 其 中 ，512 是 每 个 应 用 程序 
平均 所 含 锁 数量 的 估计 值 ，32 是 对 象 (已 有 一 把 锁 ) 上 每 把 锁 押 需 的 字 节 数 。 
(2) 计算 锁 列 表 大 小 的 上 限 : (512 * 256 *maxappls)/4096。 其 中 ，64 是 某 个 对 象 上 第 一 
把 锁 所 需 的 字 节 数 。 
(3) 对 于 数据 ， 佑 计 可 能 具有 的 并 发 数 ， 并 根据 预计 数目 为 锁 列 表 选 择 初 始 仁 ， 亡 始 
值 位 于 你 计算 出 的 上 限 和 下 限 之 间 。 
Imaxlocks 配置 参数 的 计算 方法 如 下 : 


maxlocks = 100* (512 锁 / 应 用 程序 * 128 字 节 / 锁 * 2)/(locklist * 4096 字 玫 ) 


上 述 公式 允许 任何 应 用 程序 持 有 的 锁 是 平均 数 的 两 倍 。 如 果 只 有 几 个 应 用 程序 并 屎 地 
运行 ， 那 么 可 以 增 大 maxlocks， 因 为 在 这 些 条 件 下 锁 列表 空间 中 不 会 有 太 多 和 争 用 。 
锁 升 级 会 在 以 下 两 种 情况 下 衫 触 友 : 
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e 由 某 个 应 用 程序 请 求 的 锁 占 用 的 内 存 空间 超出 了 maxlocks 和 locklist 的 乘积 大 小 。 
这 时 ， 数 据 库 管理 器 将 试图 通过 为 提出 锁 请 求 的 应 用 程序 申请 表 锁 ， 并 释放 行 锁 
来 节省 空间 。 

e 在 数据 库 中 已 被 加 上 的 全 部 锁 占 用 的 内 存 空间 超出 了 locklist 定义 的 大 小 。 这 时 ， 
数据 库 管 理 需 也 将 试图 通过 为 提出 锁 请 求 的 应 用 程序 申请 表 锁 ， 并 释放 行 锁 来 世 
省 空间 。 

虽然 锁 升 级 过 程 本 有 身 并 不 用 花 很 多 时 间 ， 但 是 锁定 整个 表 ( 相 对 于 锁定 个 别 行 ) 降 低 了 
并 发 忻 ， 而 且 数 据 库 的 整体 性 能 可 能 会 由 于 对 受 锁 升 级 影响 的 表 的 后 续 访问 而 降低 。 

在 设计 良好 的 数据 库 中 ， 很 少 发 生 锁 升级 。 如 果 锁 升级 将 并 行 性 降低 到 不 可 接受 的 程 
度 ( 由 lock escalation 监视 元 素 监 视 )， 那 么 就 需要 分 析 问 题 并 决定 如 何 解 决 此 问题 。 

锁 升 级 是 有 可 能 失败 的 ， 比 如 ， 现 在 应 用 程序 已 经 在 表 上 加 有 IX 锁 ， 在 表 中 的 某 些 
行 上 加 有 X 锁 ， 男 一 个 应 用 程序 又 来 请 求 表 上 的 IS 锁 以 及 很 多 行 上 的 S 锁 ， 这 会 由 于 申 
请 的 锁 数目 过 多 引起 锁 升 级 。 数 据 库 管理 器 试图 为 应 用 程序 申请 表 上 的 S 锁 来 减少 需要 的 
锁 数 目 ， 但 $ 锁 与 表 上 原 有 的 区 锁 冲 突 ， 锁 升级 不 能 成 功 。 

如 果 锁 升级 失败 ， 引 起 锁 升 级 的 应 用 程序 将 接 到 - 912 的 SQLCODE。 

下 面 我 们 举 一 个 实际 的 例子 。 

首先 ， 运 行 下 面 的 命令 以 打开 针对 锁 的 DB2 监视 器 : 


db2 -V update monitor switches using lock on 
db2 -Vv terminate 


然后 收集 数据 库 快照 : 
db2 -V get snapshot for database on sample | grep -1 lock 
在 快照 输出 中 ， 检 查 下 列 各 项 : 


BOCKkKS held currentily = 2Z1224 

Lock waits = 24683 

Time database waited on locks (ms) = 32875 
Lock list memory in use (Bytes) = 87224 
Deadlocks detected = 89 


Lock escalatjons = 8 

ExClUsive T1060ck Cacalations — 12 
Agents currently waiting on locks = 0 
Lock Timeouts = 0 


Internal rollbacks due to deadlock = 0 


如 果 “Lock list memory in use (Bytes)” 超 过 定义 的 LOCKLIST 大 小 的 50%， 那 么 就 增 
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加 LOCKLIST 数据 库 配 置 参 数 中 4KB 页 的 数量 。 

如 果 发 生 “Lock escalations>0 ”或 《Exclusive lock escalations>0”, 就 应 该 增 大 LOCKLIST 
或 MAXLOCKS,， 抑 或 同时 增 大 两 者 。 香 看 “Locks held currently”、“Lock waits”、“Time 
database waited on locks (ms)” 、“ Agents currently waiting on locks” 和 “Deadlocks detected ” 
中 是 奋 存 在 局 但 ， 如 果 有 的 话 ， 束 可 能 是 卉 于 最 优 访问 计划 、 事 务 时 间 较 长 或 应 用 程序 并 
发 问题 的 症状 。 


5.4.3 锁 等 待 及 调整 案例 


当 应 用 程序 不 能 够 立刻 得 到 为 对 象 请 求 的 锁 时 ， 应 用 程序 将 进入 等 竺 服务 的 队列 ， 等 
待 占 用 锁 的 应 用 程序 提交 或 回 滚 来 释放 锁 ， 这 种 情况 称 为 锁 等 待 。 锁 定 超时 检测 是 数据 库 
管理 器 功能 ， 用 于 防止 应 用 程序 在 弄 闻 情况 下 无 限时 地 等 竺 释放 锁 。 例 如 ， 事 务 可 能 正 等 符 
由 另 一 个 用 户 的 应 用 程序 挂 起 的 锁 ， 但 那个 用 户 已 离开 工作 站 ， 而 疫 有 人 允许 应 用 程序 落实 
释放 该 锁 的 事务 。 要 避免 在 这 种 情况 下 应 用 程序 继续 等 符 ， 将 locktimeout 配置 参数 设置 
为 任何 应 用 程序 应 等 到 获取 锁 的 最 长 时 间 。 这 可 以 帮助 避免 全 局 死 锁 的 情况 发 生 。 如 果 
锁 请 求 处 于 暂 挂 的 时 间 大 于 locktimeout 值 ， 那 么 请 求 应 用 程序 将 接收 到 错误 并 将 其 事务 
回 深 。locktimeout 的 默认 值 为 - 1， 天 闭锁 定 超时 检测 ; 如果 出 现 锁 等 每 ， 应 用 程序 将 会 
出 现 无 穷 等 竺 现象。 例如， 如果 APPL1 尝试 获取 已 由 APPL2 挂 起 的 锁 ， 那 么 APPL1 在 
超时 周期 到 期 时 返回 SQLCODE - 911(SQLSTATE 40001)， 原 因 码 为 68。 对 于 生产 系统 
中 的 OLAP，locktimeout 一 开始 为 60( 秒 ) 比 较 好 ， 对 于 OLTP 大 约 为 10 秒 比较 好 。 对 于 
开发 环境 ,应 该 使 用 - 1 以 识别 和 解决 锁 等 竺 的 情况 。 如 果 有 大 量 的 并 发 用 户 ， 可 能 需要 
增加 locktimeout 时 间 以 避免 回 滚 。 

如 果 快 照 监 控 结 果 输 出 中 的 “Lock Timeouts” 是 较 高 的 数 ， 那 么 可 能 是 由 以 下 原因 造 
成 的 : 


e locktimeout 的 值 太 低 
。 某 个 事务 持 有 锁 的 时 间 有 所 延长 
。 锁 升 级 


锁 等 待 可 能 会 造成 如 下 几 种 结果 ; 

引起 死 锁 ( 死 锁 是 锁 等 竺 的 特例 )， 由 和 死 锁 检测 堪 处 理 。 

等 待 超时， 等 待 的 应 用 程序 返回 SQLCODE -911 和 原因 代码 68， 并 自动 回 滚 。 超 时 

的 时 间 由 数据 库 配 置 参 数 locktimeout 设置 , 单位 为 秒 。 比 如 locktimeout 的 值 为 60， 

如 条 进行 锁 等 待 的 应 用 程序 在 60 秒 后 还 不 能 得 到 所 需 的 锁 , 应 用 程序 将 目 动 回 深 。 

e 如 果 locktimeout 的 值 被 设置 为 -1， 应 用 程序 将 永远 等 街 ， 直 到 能 够 获得 所 需要 
的 锁 。 
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e 对 于 表 、 行 、 数 据 分 区 和 MDC 块 锁 定 ， 应 用 程序 可 使 用 SET CURRENT LOCK 
TIMEOUT 来 覆盖 数据 库 级 别 的 locktimeout 设置 。 

有 时 候 ， 锁 等 竺 情形 会 导致 锁 超 时 ， 而 锁 超 时 又 会 导致 事务 被 回 滚 。 锁 等 竺 导致 锁 超 
时 所 需 的 时 间 段 由 数据 库 配置 参数 locktimeout 指定 。 锁 超时 分 析 最 大 的 问题 是 ， 不 知道 下 
一 次 的 锁 超 时 何 时 发 生 。 为 了 捕捉 死 锁 ， 可 以 创建 死 锁 事件 监视 器 。 每 当 出 现 死 锁 时 ， 这 
个 死 锁 事 件 监视 器 便 写 一 个 条 目 。 同 样 ， 对 于 锁 超 时 也 有 类 似 的 事件 监视 占 。 下 面 的 语句 
可 以 创建 锁 相 关 的 事件 监控 占 。 


db2 "Create event monitor LOCKEVMON for locking write to unformatted event 
table (tapbple LOCKEVMON 1n db2tool PCTDEACTIVATE 85) autostart™ 


分 析 锁 事件 监视 器 所 生成 的 数据 ， 需 要 使 用 基于 Java 的 通用 XML 解析 器 工具 
db2evmonfmt， 可 以 将 生成 可 读 的 纯 文本 输出 (文本 版 本 ) 或 格式 化 XML 输出 。 根 据 指定 的 
参数 ，db2evmonfmt 工具 将 确定 事件 监视 占 数 据 的 解析 方式 以 及 所 要 创建 的 输出 类 型 。 

db2evmonfmt 工具 以 Java 源 代 人 码 的 形式 提供 。 在 使 用 此 工具 之 前 ， 必 须 通 过 执行 下 列 
步骤 来 设置 和 编译 此 工具 : 

(1) 在 sqllib/samples/java/jdbc 目录 中 找到 源 代 但 

(2) 按照 Java 源 文件 中 嵌入 的 指示 信息 来 设置 和 编译 此 工具 

还 可 以 随意 修改 源 代码 以 更 改 输出 。 

此 工具 使 用 XSLT 样式 表 将 事件 数据 变换 为 市 格式 文本 。 不 需要 理解 这 些 样式 表 。 此 
工具 将 根据 事件 监视 右 类 型 日 动 装 入 正确 的 样式 表 并 变换 事件 数据 。 每 个 事件 监视 占 部 将 
在 sqllib/samples/xml/data 目录 中 提供 献 认 样式 表 。 此 工 上 其 还 提供 了 下 列 过 小 选项 : 

e。 事件 标识 

e 事件 时 间 戳 记 


e 事件 类 型 
e 工作 负载 名 
e 服务 类 名 


e 应 用 程序 名 

下 面 的 命令 是 一 个 简单 的 用 法 示例 

ed /tmp 

cp ~/sgllib/samples/Java/Jdbc/db2evmonfmt.Java 


~/sSqllib/samples/Java/Jdbc/DB2EvmonNnLoOCcKking .Xsl1 
~/Sqllib/jJava/jJdk64/bin/Javac db2evmonfmt . ] avVa 
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~/Sgqllib/Java/Jdk64/bin/Java db2evmonfmt -~d DBNAME -Ue LOCKEVMON -ftext 
> dbz2locks.out 


一 旦 定位 引起 锁 等 每 的 SQL 语句 ， 如 果 该 SQL 语句 写 的 效率 很 低下 ， 可 以 考虑 对 该 
SQL 语句 做 出 调整 ， 如 果 该 SQL 语句 中 没有 创建 最 合理 的 索引 ， 可 以 考虑 用 db2advis 工 
具 为 该 SQL 语句 创建 最 合理 的 索引 。 

传统 的 锁定 方法 会 导致 应 用 程序 互相 阻塞 。 当 某 个 应 用 程序 必须 等 待 另 一 个 应 用 程序 
释放 锁定 时 ， 阻 塞 就 会 发 生 。 用 于 处 理 这 种 阻塞 的 影响 的 策略 通 稼 会 提供 一 种 机 制 以 指定 
最 大 可 接受 的 阻塞 持续 时 间 ， 这 就 是 应 用 程序 在 不 能 获取 锁定 的 情况 下 在 返回 之 前 等 得 的 
时 间 。 

以 前 , 只 能 在 数据 库 级 别 通 过 更 改 locktimeout 数据 库 配 置 参数 的 值 来 指定 时 间 。 现 在 ， 
锁 等 待 方 式 策 略 通 过 新 的 SET CURRENT LOCK TIMEOUT 语句 指定 ， 此 语句 更 改 


CURRENT LOCK TIMEOUT 专用 寄存 器 的 值 - CURRENT LOCK TIMEOUT 专用 寄存 器 指 


定 在 不 能 获取 锁定 错误 之 前 等 待 锁 定 的 秒 数 。 
5.4.4 有 死 锁 及 调整 案例 


死 锁 的 产生 是 由 于 锁 请 求 双方 都 彼此 持 有 对 方 所 需要 的 锁 ， 这 种 情况 下 又 去 请 求 锁 而 
导致 死 锁 的 产生 。 

下 面 我 们 通过 一 个 典型 的 例子 来 说 明 死 锁 的 概念 。 

假定 事务 1 在 表 A 上 获取 了 互 斥 CO) 锁 ， 而 事务 2 在 表 B 上 获取 了 互 斥 CO 锁 。 现 在 ， 
假定 事务 1 尝试 在 表 B 上 获取 互 斥 C 弘 锁 ， 而 事务 2 尝试 在 表 A 上 获取 互 斥 CO) 锁 。 这 两 个 
事务 的 处 理 都 将 被 挂 起 ， 直 到 同意 第 二 个 锁 请 求 为 止 。 但 是 ， 因 为 在 任何 一 个 事务 释放 自 
身 目 前 持 有 的 锁 (通过 执行 或 回 深 操 作 ) 之 前 ， 这 两 个 事务 的 锁 请 求 都 不 会 被 同意 ， 而 且 因 
为 这 两 个 事务 都 不 能 释放 各 上 自 目 前 持 有 的 锁 ( 因 为 它们 都 已 挂 起 并 等 待 锁 )， 所 以 它们 都 陷 
入 了 死 锁 循环 。 图 5-11 说 明了 这 个 死 锁 场景 。 

当 死 锁 循 环 发 生 时 ， 除 非 某 些 外 部 代理 进行 干涉 ， 和 否则 涉及 的 所 有 事务 将 无 限期 地 等 
待 释放 锁 。 在 DB2 UDB 中 ， 用 于 处 理 死 锁 的 代理 是 被 称 为 死 锁 检测 器 的 异步 系统 后 台 进 
程 。 死 锁 检 测 器 的 唯一 职责 是 定位 和 解决 在 锁定 子 系统 中 找到 的 任何 死 锁 。 每 个 数据 库 都 
有 目 己 的 死 锁 检 测 咒 ， 在 数据 库 初 始 化 过 程 中 激活 。 激 活 之 后 ， 死 锁 检 测 器 在 大 多 数 时 间 
处 于 “休眠 ”状态 ， 但 会 以 预 置 的 时 间 间 隅 被 “唤醒 ”， 以 确定 锁定 子 系统 中 是 否 存 在 死 
锁 循 环 。 如 果 死 锁 检 测 器 在 锁定 子 系统 中 发 现 死 锁 ， 那 么 随机 选择 死 锁 涉 及 的 事务 ， 终 止 
并 回 深 。 选 择 的 事务 收 到 SQL 错误 编 公 ( - 911)， 该 事务 获得 的 所 有 锁 部 被 释放 。 这 样 ， 
剩 下 的 事务 就 可 以 继续 执行 了 ， 因 为 死 锁 循环 已 经 被 打破 了 。 
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SQL operation 
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End transaction 


Transaction 1 is waiting for 


transaction 2 to release its 
lock on table B 


Transaction 2 


Start transaction 


SQL operation 
SQL operatlion 
SOL operation 


md === 
| 


SQL operation 
QL operation 
SQL operation 
COmMmMml1t 

End transaction 


Transaction 2 1S waliting for 
transaction 1 to release its 
lock on table A 


图 5-11 死 锁 循环 示例 


这 就 是 死 锁 的 典型 情况 ， 两 个 应 用 程序 互相 持 有 对 方 所 需要 的 锁 ， 在 得 不 到 自己 所 需 


要 的 锁 的 情况 下 ， 也 不 会 释放 现 有 的 锁 。 


下 面 我 们 再 举 一 个 死 锁 的 例子 。 
模拟 一 个 死 锁 场景 。 为 了 方便 模拟 ， 我 们 将 当前 提交 关闭 


sdb2 paate db cfg for test UsiIng cur Commit off 

DB20000I The UPDATE DATABASE CONFIGURATION command completed successfully. 
sdb2stop force 

SQL1064N DB2STOP processing was successful. 

sdb2start 

SQL1063N DB2START processing was successful. 


打开 两 个 单独 的 命令 行 CLP 窗口 。 
(1) 在 第 一 个 窗口 中 (图 5-12 所 示 )， 执 行 以 下 命令 (在 每 个 命令 后 面 按 回 车 键 ): 
UPDATE COMMAND OPTIONS USING CC OFF 


(注意 : 这 会 关闭 自动 提交 ) 
CONNECT TO TEST 
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CREATE TABLE deadtable (cl INTEGER) 
COMMIT 
INSERT INTO deadtable VALUES (1) 

db2 => UPDATE COMMAND OPTIONS USING ec OFF 


DB20000I The UPDATE COMMAND OPTIONS command completed successfullv. 
db2 => CONNECT TO TEST 


Database Connection lnformatlion 


Database server = DB2/AIX64 9.7.6 
SQL authorization ID DB2INST4 


Local database alias TEST 


db2 =>》 CREATE TABLE deadtable (cl INTEGER) 
DB20000I1 The SQL command completed successfully. 
db2 =» COMMIT 

DBH20000I The SQL command completed successfullvy. 
db2 => INSERT INIU deadtable VALUES (1] 

DB20000] The SQL command completed successftully. 


图 5-12 ”人 死 鲍 场 太 1 


(2) 在 第 二 个 窗口 中 (图 5-13 所 示 )， 执 行 以 下 命令 


UPDATE COMMAND OPTIONS USING C OFF 
(注意 : 这 会 关闭 日 动 提交 ) 

CONNECT TO TEST 

INSERT INTO deadtable VALUES (2) 
SELECT * FROM deadtable 

(你 会 看 到 光标 不 动 了 ) 


db2 =» UFDATE COMMAND OPIIONS USING ¢ OFF 

DB20000I The UPDATE COMMAND OPIIONS command completed successfully. 

db2 =» CONMNECT TO TEST 

SQLOTS2N Connecting to a database 1s not permitted within a logical unit of 
work When the CONNECT tvpe 1 setting is in use. SQLSTATE=OQAOQO] 


db2 三 > INSERT INTO deadtable VALUFS (2) 
DB20000I1 The SQL command commleted successfullyv. 
db2 =» SELECT 说 FROM deadtable 


图 5-13 ” 死 饥 场景 2 


(3) 在 完成 第 (2) 步 之 后 , 等 竺 大约 15 秒 。 然后, 在 第 一 个 窗口 中 , 执行 以 下 命令 (图 5-14 
所 未): 


SELECT * FROM deadtable 


207 


DB2 数据 库 性 能 调整 和 优化 (第 3 版 ) 


Idb2 => INSERT INTO deadtable VALUES 
IDB20000I The SQL command completed successfully. 
Ildb2 => SELECT * FROM deadtable 


IC1 


1 


1] record(s) selected. 


db2 => 四 
图 5-14 在 第 一 个 窗口 中 执行 命令 


(4) 这 时 会 发 生死 锁 ， 因 为 第 一 个 窗口 和 第 二 个 窗口 都 在 等 待 对 方 释放 锁 ， 必 须 让 其 
中 某 个 事务 回 滚 ， 才 能 打破 锁 冲突 。DB2 死 锁 监视 器 进程 会 在 10 秒 内 选择 某 个 事务 并 回 
深 。10 秒 是 默认 设置 ， 也 可 以 通过 数据 库 配 置 参数 DLCHKTIME 来 设置 。 一 个 窗口 将 返 
回 查 询 结果 ， 另 一 个 窗口 将 返回 死 锁 消息 (图 5-15 所 示 )。 


db2 => UPDATE COMMAND OPTIONS USING ec OFF 

DB20000] Tne UPFDATE COMMANMD QFIIONS eommand completed successfully. 

db2 =» CONNECIT IO TES]1 

SQLOD2N Connecting to a database is not permitted within a logical unit of 
work when the COMMEC] tvpe | settine is in Use. SQLSITATE=0A00] 

db2 =» INSERT INTO deadtable VALUESIL2) 


DB20000] The SQL command completed succesgfully. 

dba =» SELECT FROM deadtable 

SQLO911N lhe current transactlon has been rolled back because of a deadlock 
or timeout. Reason code 2 . SQLSTATE=4000] 


db2 三 | 


图 5-15 第 二 窗口 返回 死 锁 消 息 


DB2 利用 名 为 死 锁 检测 器 的 后 台 进 程 进行 死 锁 检测 ， 该 进程 每 隔 一 定 的 时 间 进 行 一 次 
检测 ， 一 旦 有 友 现 死 锁 ， 该 进程 束 会 选择 某 个 牺牲 者 。 牺 牲 者 将 目 动 回 滚 ， 释 放 反 占 用 的 锁 
并 返回 SQLCODE -911 和 原因 代码 2， 死 锁 可 以 消除 。 

注意 ，DB2 死 锁 检测 器 会 随机 选择 牺牲 者 ， 因 此 ， 不 能 确定 哪个 更 新 将 发 生 回 滩 。 在 
上 面 描述 的 场景 中 ,第 二 个 更 新 发 生 回 滚 ,但 是 你 在 测试 时 ,也许 是 第 一 个 更 新 发 生 回 滚 。 

dlchktime 是 设置 死 锁 检查 间隔 的 配置 参数 , 该 参数 以 室 秒 为 单位 , 有 效 范围 是 1000ms 
全 600000ms。 该 但 过 局 将 增加 应 用 程序 等 待 死 锁 和 被 友 现 的 时 间 ， 如 果 过 低 ， 死 锁 检 测 的 间 
隔 昌 然 加 快 ， 但 却 降 低 了 少许 运行 性 能 。 该 参数 的 默认 值 为 10000ms(10 秒 )。 

可 能 引起 死 锁 的 情况 及 影响 程度 包括 : 

应 用 程序 的 隔离 级 别 采 用 可 重复 读 和 读 稳定 性 (主要 ) 
锁 升 级 (主要 ) 

锁 转 换 ( 次 要 ) 

编目 表 的 更 改 (中 等 ) 
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e 参照 完整 性 的 约束 (次 要 ) 

确定 并 僵 看 快照 输出 结果 中 “Deadlocks detected” 中 是 任 存 在 局 值 ， 如 果 有 的 话 ， 束 
可 能 是 差 于 最 优 访问 计划 、 事 务 时 间 较 长 或 应 用 程序 并 发 问题 的 症状 。 如 果 要 发 现 死 锁 ， 
那么 需要 创建 针对 死 锁 的 事件 监视 器 或 db2pd 工具 。 事 件 监视 器 带 有 详细 信息 ， 以 便 查看 
当前 正在 发 生 的 事情 。 


create event monitor deadlock for deadlocks write to table 


当 我 们 在 事件 监视 结果 中 定位 了 引起 死 锁 的 SQL 语句 后 ， 如 果 该 SQL 语句 与 的 效率 
很 低 ， 可 以 考虑 对 该 SQL 语句 进行 调整 如 果 该 SQL 语句 中 没有 创建 最 合理 的 索引 ， 可 
以 考虑 用 db2advis 工具 为 该 SQL 语句 创建 最 合理 的 索引 |。 


最 小 化 死 锁 建议 

e 在 整个 应 用 程序 中 ， 总 是 按 相 同 底 序 访问 资源 可 以 最 小 化 死 锁 。 人 例如， 如果 某 个 
应 用 程序 组 件 将 要 访问 表 A,， 然后 是 表 B， 接 着 是 表 C; 而 另 一 个 应 用 程序 组 件 需 
要 访问 表 A 和 C， 那 么 第 2 个 组 件 应 该 遵循 先 A 后 C 的 访问 次 序 。 

e 对 于 DB2 V9 以 前 的 版 本 ,导致 死 锁 的 常见 原因 是 锁 列 表 数 据 库 配置 参数 的 大 小 不 
足 ， 尤 其 是 使 用 默认 值 时 ， 因 此 应 该 合理 地 设置 LOCKLIST 和 MAXLOCKS 配置 
参数 。 默 认 情 况 下 DB2 V9 使 用 STMM， 它 会 调整 锁 列 表 大 小 以 避免 可 能 由 此 引 
起 的 锁 升 级 和 和 死 锁 。 

e 人 确保 参照 完整 性 (Referential Integrity，RD 关 系 中 的 依赖 表 拥 有 与 外 键 匹 配 的 索引 。 


5.5 ” 锁 相 关 的 性 能 问题 总 绪 


调整 锁定 以 实现 并 行 性 和 数据 完整 性 时 ， 应 考虑 下 列 准 则 ; 

e 频繁 使 用 COMMIT 语句 来 创建 较 小 的 工作 单元 以 使 许多 用 户 可 以 并 发 访问 数据 。 
当 应 用 程序 在 逻辑 上 一 致 时 ， 即 当 更 改 的 数据 一 致 时 ， 发 出 COMMIT 语句 。 当 发 
出 COMMIT 时 ， 释 放 锁 定 ， 与 声明 了 WITH HOLD 的 游标 相关 的 表 锁 定 除 外 。 

e 在 发 出 COMMIT 语句 之 前 ， 应 先 关 闭 CURSOR WITH HOLD。 在 某 些 情况 下 , 在 
结果 集 关 财 并 且 和 事务 洛 实 后 锁定 仍然 存在 。 在 发 出 COMMIT 语句 之 前 关闭 
CURSOR WITH HOLD 可 确保 释放 锁定 。 

e 指定 适当 的 隔离 级 别 。 即 使 应 用 程序 很 少 读 取 行 ， 也 会 获得 锁定 ， 所 以 落实 只 读 
工作 单元 仍 很 重要 。 这 是 因为 在 只 读 应 用 程序 中 通过 可 重复 谈 、 读 稳定 性 及 游标 
稳定 性 隔离 级 别 可 以 获得 共享 锁定 。 借 助 于 可 重复 谈 和 恋 稳 定性 ， 可 挂 起 所 有 锁 
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定 ， 直 到 发 出 COMMIT， 这 可 以 阻止 其 他 进程 更 新 锁定 的 数据 ， 除 非 使 用 WITH 
RELEASE 子 句 关闭 诉 标 。 此 外 ， 甚 全 在 使 用 动态 SQL 语句 的 未 提交 访 应 用 程序 
中 也 要 获得 目录 饥 定 。 数 据 库 管 理 堪 确保 应 用 程序 不 检索 未 提交 数据 (其 他 应 用 程 
厅 已 经 更 新 但 尚未 洛 实 的 行 )， 除 非 正在 使 用 未 提交 恋 隐 离 级 别 。 
e 适当 地 使 用 LOCK TABLE 语句 。 该 语句 锁定 整个 表 ， 但 只 锁定 LOCK TABLE 语 
句 中 指定 的 表 。 不 锁定 指定 表 的 父 表 和 从 属 表 。 必 须 确定 是 否 需要 锁定 其 他 可 访 
问 的 表 以 便 在 并 行 性 与 性 能 方面 达到 期 望 的 结果 。 在 工作 单元 被 落实 或 回 深 之 前 
不 释放 锁定 。 
以 共享 方式 锁定 表 


想 要 访问 在 时 间 上 一 致 的 数据 一 一 表 在 特定 时 间 点 的 最 新 数据 。 如 果 表 活动 频繁 ， 那 
么 确保 整个 表 保持 稳定 的 唯一 方法 是 将 其 锁定 。 例如， 应 用 程序 想 要 抽取 表 的 快照 。 但 是 ， 
允许 这 样 的 操作 ， 


在 应 用 程序 需要 处 理 表 的 一 些 行 期 间 ， 其 他 应 用 程序 正在 更 新 还 没有 处 理 的 行 。 可 重复 读 
日 你 不 希望 这 样 。 


另 一 种 方法 是 ， 应 用 程序 可 以 发 出 LOCK TABLE IN SHARE MODE 语句 : 无 论 是 否 
检索 它们 之 前 还 没有 被 更 改 。 


位 索 到 行 ， 虱 不 能 更 改 任何 行 。 然 后 可 以 控 需 要 检索 任 总 多 行 ， 应 了 解 已 经 检索 的 行 束 在 
除 表 中 的 行 或 将 行 插 入 表 中 。 


日 ? 


使 用 LOCK TABLE IN SHARE MODE， 其 他 用 户 可 从 表 中 检索 数据 ， 但 不 能 更 新 、 删 
以 互 斥 方式 锁定 表 


想 要 更 新 表 的 大 部 分 。 相 对 于 更 新 表 时 锁定 每 一 行 ， 然 后 在 钞 实 所 有 更 改 时 解锁 行 而 

该 方式 阻止 所 有 其 他 用 户 访问 该 表 的 开销 少 并 且 更 有 效 。 

使 用 LOCK TABLE IN EXCLUSIVE MODE， 所 有 其 他 用 户 都 被 锁定 在 外 :没有 其 他 

应 用 程序 可 以 访问 该 表 ， 除 非 它们 是 未 提交 访 应 用 程序 。 
在 应 用 程序 中 使 用 ALTER TABLE 语句 。 


各 LOCKSIZE 参数 的 ALTER TABLE 语句 是 LOCK TABLE 语句 的 备用 语句 。LOCKSIZE 
参数 允许 指定 下 一 次 表 访 问 的 ROW 锁定 或 TABLE 锁定 的 锁定 详细 程度 。 


当 新 建 表 时 , 选择 ROW 锁定 同 选 择 默 认 锁定 大 小 无 任何 区 别 。 选 择 TABLE 锁定 可 提 
整 的 表 上 而 降低 。 仍 然 会 对 所 有 其 他 操作 执行 行 级 锁定 ， 并 对 键 插 入 行 级 锁定 以 保护 可 重 


高 查询 性 能 ， 方 法 是 限制 需要 获取 的 锁定 的 数目 。 但 是 ， 并 行 性 可 能 由 于 所 有 锁定 位 于 完 
复 谈 (RR) 扫 摘 程 序 。 
关闭 游标 以 释放 它们 挂 起 的 锁定 。 
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中 尝试 释放 所 有 为 诉 标 挂 起 的 谈 锁 定 。 表 该 锁定 是 IS、S 和 TU 表 锁 定 。 行 谈 锁 定 是 S、NS 
和 TU 行 锁 定 。 块 读 锁 定 是 JI、S 和 TU 块 锁定 。 

WITH RELEASE 子 句 对 正在 CS 或 UR 隔离 级 别 下 操作 的 游标 不 起 作用 。 当 对 正在 
RS 或 RR 隔离 级 别 下 操作 的 游标 指定 WITH RELEASE 子 句 后 ， 将 结束 那些 隔离 级 别 的 
一 些 保证 。 明 确 地 说 ，RS 游标 可 能 经 历 不 可 重复 读 现象 ， 而 RR 游标 不 会 发 生 不 可 重复 
读 或 幻像 读 现象 。 

如 果 原 来 是 RR 或 RS 的 游标 通过 使 用 WITH RELEASE 子 句 关 闭 后 重新 打开 , 那么 将 
获得 新 的 读 锁定 。 

在 CLI 应 用 程序 中 ，DB2 CLI 连接 属性 SQL ATTR CLOSE BEHAVIOR 可 用 来 获得 
与 CLOSE CURSOR WITH RELEASE 相同 的 结果 。 


5.6 ” 镶 与 应 用 程序 设计 


为 了 确定 锁定 属性 ， 可 以 将 应 用 程序 处 理 划 分 为 下 列 类 型 的 其 中 一 种 : 
e 只 该 : 此 类 型 包括 所 有 这 样 的 选择 语句 ， 它 们 本 映 是 只 谍 的 ， 并 上 共有 显 式 的 FOR 
READ ONLY 子 句 ; 或 者 是 模糊 的 (但 是 查询 编译 器 因为 PREP 或 BIND 命令 指定 
了 BLOCKING 选项 的 值 而 假定 它们 是 只 读 的 )。 此 处 理 类 型 只 要 求 “ 共 享 ” 锁 定 (S、 
NS 或 IS)。 
e 更 改 意向 : 此 类 型 包括 具有 FOR UPDATE 的 SELECT 语句 ， 或 者 查询 编译 器 解 
释 有 上 监 义 的 语句 以 表示 想 进 行 更 改 。 此 类 型 使 用 “共享 ”和 “更 新 ”锁定 (对 于 行 ， 
为 S、U 和 X; 对 于 表 ， 为 以、U 和 叉 )。 
e 更 改 : 此 类 型 包括 UPDATE、INSERT 及 DELETE， 但 不 包括 UPDATE WHERE 
CURRENT OF 或 DELETE WHERE CURRENT OF。 此 类 型 要 求 “ 互 斥 ” 锁 定 (X 
或 I[X)。 
e 受 控 游标 :此 类 型 包括 UPDATE WHERE CURRENT OF 和 DELETE WHERE 
CURRENT OF 。 此 类 型 也 要 求 “ 互 不 ”锁定 (多 或 芍 )。 
根据 子 僵 询 语句 的 结果 ， 在 日 标 表 中 进行 插入 、 更 新 或 删除 数据 的 语句 ， 执 行 丙种 类 
型 的 处 理 ， 只 旋 处 理 规则 确定 对 在 子 选 择 语 句 中 返回 的 表 的 锁定 ; 更 改 处 理 规则 确定 对 日 
标 表 的 锁定 。 
优化 器 假定 应 用 程序 必须 检索 由 SELECT 语句 指定 的 所 有 行 ， 此 假设 最 适合 于 OLTP 
和 批 处 理 环境 。 但 是 ， 在 “浏览 ”应 用 程序 中 ， 答 询 经 音 定 义 可 能 很 大 的 答案 集 ， 但 它们 
只 检索 前 几 行 ， 通 种 只 检索 填 满 屏幕 所 需 的 那么 多 行 。 
要 提高 这 种 应 用 程序 的 性 能 ， 可 以 按 下 列 方式 修改 SELECT 语句 : 
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使 用 FOR UPDATE 子 句 指 定 可 由 后 续 定 位 的 UPDATE 语句 更 新 的 列 。 

使 用 FOR READ/FETCH ONLY 子 句 使 返回 的 列 为 只 读 的 。 

使 用 OPTIMIZE FOR n ROWS 子 句 授予 检 索 整 个 结果 集中 前 n 行 的 优先 级 。 
使 用 FETCH FIRSTn ROWS ONLY 子 句 仅 检 索 指定 的 几 行 。 

使 用 DECLARE CURSOR WITH HOLD 语句 每 次 检索 一 行 。 


注意 : 
如 果 使 用 FOR UPDATE、FETCH FIRST n ROWS ONLY 或 OPTIMIZE FOR n ROWS 
子 句 ， 或 者 声明 游标 为 “滚动 ”， 那 么 会 影响 行 分 块 。 


FOR UPDATE 子 句 

FOR UPDATE 子 句 通过 仪 包 含 可 由 后 续 定 位 的 UPDATE 语句 更 新 的 列 来 限制 结果 集 。 
如 果 不 带 列 名 指定 FOR UPDATE 子 句 ， 那 么 包括 表 或 视图 的 全 部 可 更 新 列 。 如 果 指 定 列 
名 ， 那 么 每 个 名 称 必须 是 非 限 定 的 ， 并 且 必 须 标 识 表 或 视图 的 某 一 列 。 

在 下 列 情况 下 ， 不 能 使 用 FOR UPDATE 子 句 : 

e 不 能 删除 与 SELECT 语句 关联 的 游标 。 

e 选择 的 列 中 至 少 有 一 列 是 目录 表 的 不 可 更 新 列 ,， 并 且 没 有 在 FOR UPDATE 子 句 中 

排除 挥 。 

由 于 相同 的 目的 ,可 将 DB2 CLI 连接 属性 SQL ATTR ACCESS MODE 用 于 CLI 应 用 

程序 中 。 


FOR READ ONKY 或 FOR FETCH ONLY 子 铝 

FOR READ ONLY 或 FOR FETCH ONLY 子 句 确保 返回 只 读 结果 。 因 为 在 被 定义 为 只 
读 的 视图 中 ，SELECT 的 结果 表 也 是 只 读 的 ， 所 以 允许 此 子 句 但 没有 作用 。 

对 于 允许 更 新 和 删除 的 结果 表 ， 如 果 数 据 库 管理 器 可 以 检索 数据 块 而 不 是 互 斥 锁定 ， 
那么 指定 FOR READ ONLY 可 能 会 提高 FETCH 操作 的 性 能 。 不 要 对 用 于 定位 的 UPDATE 
或 DELETE 语句 的 但 询 使 用 FOR READ ONLY 于 人 句 。 

由 于 相同 的 目的 , 可 将 DB2 CLI 连 接 属性 SQL AITR ACCESS MODE 用 于 CLI 应 用 
程序 。 


OPTIMIZE FOR n ROWS 子 句 

OPTIMIZE FOR 子 句 声明 只 想 检 索 结 果 的 某 个 子 集 或 优先 检索 前 儿 行 。 优 化 旨 然 后 可 
以 优先 选择 把 检索 前 几 行 的 啊 应 时 间 减 至 最 短 的 访问 方案 。 另 外 ， 作 为 单个 块 发 送 到 客户 
机 的 行 数 由 OPTIMIZE FOR 子 句 中 的 “n” 值 来 限制 。 因 此 ，OPTIMIZE FOR 子 句 既 影 响 
服务 顺从 数据 库 检 索 合 格 行 的 方式 ， 又 影响 将 合格 行 返 回 到 客户 机 的 方式 。 
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例如 ， 假 设 定期 得 询 职员 表 来 得 找 具 有 最 局 工资 的 职员 : 


SELECT LASTNAME, FTIRSTNAME, EMPNO, SALARY 
FROM EMPLOYEE ORDER BY SALARY DESC 


上 而 定义 了 基于 SALARY 列 的 降序 索引 。 但 是 ， 因 为 职员 是 按 职 员 号 排序 的 ， 所 以 工 
资 索引 可 能 很 难 集群 。 为 了 尽量 避免 许多 随机 的 同步 WO， 优化 器 将 可 能 选择 使 用 列表 预 
取 访 问 方法 ， 此 方法 需要 对 合格 的 所 有 行 的 行 标识 排序 。 在 将 前 几 个 合格 行 返 回 至 应 用 程 
序 前 ， 此 排序 可 能 导致 延迟 。 要 防止 此 延迟 ， 可 向 语 铝 添加 OPTIMIZE FOR 子 句 ， 如 下 
所 示 : 


SELECT LASTNAME, FIRSTNAME, EMPNO, SALARY FROM EMPLOYEE 
ORDER BY SALARY DESC OPTIMIZE FOR 20 ROWS 


在 此 情况 下 ， 优 化 器 可 能 选择 直接 使 用 SALARY 索引 ， 因 为 只 检索 具有 最 高 工资 的 
20 个 职员 。 不 管 可 以 将 多 少 行 分 块 ， 而 只 把 由 每 20 行 组 成 的 块 返回 全 客户 机 。 

使 用 OPTIMIZE FOR 子 句 ， 优 化 需 优 先 选 择 可 以 避免 大 量 操作 或 中 断 行 流动 (如 排序 ) 
的 访问 方案 。 使 用 OPTIMIZE FOR 1 ROW 最 有 可 能 有 影响 访问 路 人 符 。 使 用 此 子 句 可 以 有 下 
列 作用 : 

e 连接 方法 可 以 更 改 。 网 套 循 环 连接 是 非常 可 能 的 选择 ， 因 为 具有 低 开 销 成 本 ， 并 
日 通常 在 检索 少 量 行 时 更 有 效率 。 

与 ORDER BY 子 句 匹配 的 索引 更 可 能 ， 因 为 对 于 ORDER BY 不 需要 排序 。 
列表 预 取 不 大 可能， 因为 此 访问 方法 需要 排序 。 

顺序 预 取 不 太 可 能 ， 因 为 只 需要 知道 少量 的 几 行 。 

在 连接 查询 中 ， 在 ORDER BY 子 句 中 包含 列 的 表 可 能 被 选 作 外 部 表 ， 前 提 是 外 部 
表 上 的 某 个 索引 提供 ORDER BY 子 句 所 需 的 排序 。 

OPTIMIZE FOR 子 句 虽然 适用 于 所 有 优化 级 别 ， 但 却 在 优化 级 别 3 和 更 融 级 别 下 工作 
得 最 好 。 因 为 级 别 3 以 下 的 级 别 使 用 “ 贫 歼 ”连接 枚 举 方法 ， 此 方法 有 时 会 产生 不 能 使 它 
们 目 己 很 快 检索 前 几 行 的 多 表 连 接 的 访问 方案 。 

OPTIMIZE FOR 子 句 不 阻止 检索 全 部 合格 行 。 如 果 确 实 要 检索 全 部 合格 行 ， 那 么 总 耗 
用 时 间 可 能 大 大 高 于 优化 塔 为 整个 答案 集 进 行 优化 所 需 的 时 间 。 

如 果 已 打包 的 应 用 程序 使 用 调用 级 接口 (DB2 CLI 或 ODBC)， 可 在 db2cliini 配置 文件 
中 使 用 OPTIMIZE FOR N ROWS 关键 学 , 让 DB2 CLI 目 动 将 OPTIMIZE FOR n ROWS 子 铝 
追加 至 每 个 查询 语句 的 末尾 。 
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FETCH FIRST n ROWS ONLY 子 铝 

FETCH FIRST n ROWS ONLY 子 句 设置 可 检索 的 最 大 行 数 。 将 结果 表 限 制 为 只 包含 前 
儿 行 可 提高 性 能 。 无 论 结果 集 可 能 另外 包含 多 少 行 ， 只 检索 nn 行 。 

如 果 同 时 指定 FETCH FIRST 子 句 和 OPTIMIZE FOR 子 句 ， 那 么 这 两 个 值 中 较 小 的 那 
个 影响 通信 缓冲 区 (RQRIOBLKE， 最 大 请 求 IO 块 ) 大 小 。 为 了 达到 最 优化 ， 将 这 两 个 值 看 
作 互 不 相关 的 。 


DECLARE CURSOR WITH HOLD 语句 

当 用 包括 WITH HOLD 子 句 的 DECLARE CURSOR 语句 声明 游标 时 ,在 落实 该 事务 时 
任何 打开 的 游标 仍然 打开 ,并 且 释 放 所 有 锁定 (保护 打开 的 WITH HOLD 游标 的 当前 游标 位 
置 的 锁定 除外 )。 

如 末 回 滩 事 务 ， 那 么 关闭 所 有 打开 的 诉 标 并 释放 所 有 锁定 


5.7 人 锁 监 控 工 具 

在 DB2 中 对 锁 进 行 监控 有 很 多 工具 : 快照 监控 、 事 件 监 控 和 db2pd。 和 下面 分 别 举例 
说 明 。 

1. 快照 监控 方式 


在 使 用 快照 方式 对 锁 进行 监控 之 前 ， 必 须 把 监控 锁 的 开关 打开 ， 可 以 从 实例 级 别 或 会 
话 级 列 打 开 ， 具 体 命令 如 下 : 


db2 update dbm cfg using dft mon lock on -- 实 例 级 别 
db2 update monitor switches using lock on  -- 会 话 级 别 ， 推 荐 使 用 


开关 打开 后 ， 可 以 执行 下 列 命 令 来 进行 锁 监 挥 : 
db2 get snapshot for locks on deV 
数据 库 dev 中 具体 锁 的 详细 信息 如 下 : 


Database Lock snapshot 


Database name = DEYV 

Database path = /db27DEVVdb2adev7NODE0O0007SQL0O00017 
Input database alias = DEV 

Locks held = 49 

Applications currently connected = 38 

Agents currently waiting on locks = 6 


snapshot 七 Imestamp 
Application handle 
Application ID 

Sequence number 

Application name 

Authorization ID 

Application status 

status change time 

Application code page 

LOCKS held 

Total wait time (ms) 

Application handle 

Application ID 

Sequence number 

Application name 

Authorization ID 

Application status 

status change time 

Application code page 

Locks held 

Total wait 七 IIme (ms) 
Subsection waiting for lock 
ID of agent holding lock 
Application ID holding lock 
Node lock walt occurred on 
Lock obJjJect type 
Lock mode 
Lock mode requested 
Name of tablespace holding lock 
Schema of table holding lock 
Name of table holding lock 
Lock wait start timestamp 
Lock 1i5s5 a result of escalation 

List :Of TOCKS 
Lock Object Name 

Node number lock 1is held at = 0 
Object Type 

Tablespace Name 

Table Schema 

Table Name 

Mode 

Status 

Lock Escalation 
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= LI 20L3 1520-00 931L34 
= 6 


= LOCAL.db2dew.1308150zZ1001 


= O0001 

= disp+work 

= SAPR3 

= UOW Waiting 


sy 


= 


= LOCAG.db2dev. 130815060819 
0001 


= SAPR3 


= Lock-wait 

-D0 To 2013 T9085 20 .302332 
一 B819 

6 

= 1060648 

= 0 

= 100 
= *LOCAL.db2dev.1308123061638 
= 0 


= Row 


Exclusive Lock (X) 
= ExcCclusive Lock (X) 
~ PSAPBTABD 
= SAPR3 
TPLOGNAMES 
= 08-15-2013 15:08:20.302356 
= NO 


= 29204 


= Table 

= PSAPBTABD 
= SAPR3 

= TPLOGNAMES 
= 

= Granted 

= NO 
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LOCK Escalation — NO 


2. 事件 监控 方式 


当 使 用 事件 监控 器 进行 死 锁 
创建 事件 : 
db2 create event monitor dlock for deadlocks with details write to file 


' SHOME/d1ir' 
db2 set event monitor dlock state 1 


二 
一 


db2evmon -ab sample 一 eVvm dlock 
Deadlocked Connection 
Deadlock ID: 4 
Participant es 1 
Particinant To haldng the Lock: 2 
Appl Id: GS9BSI8B1IE.DAEA-.08D38 171230811 
APPT Seq number: 0336 
Appl Id of connection holding the lock: G9B58B1E.D573.079237231003 
Seq. no. of connection holding the lock: 0126 
Lock walt start time: 06/08/2015 08:10:34.219490 


LoCck Name : Ox000201320000030E0000000022 

Lock Attributes : 0x00000000 

Release Flags : Dx40000000 

LOCk Count = 

Hold Count = 

Current Mode "NS — Share and MNexE Eey Share) 
Deadlock detection time: 06/08/2015 08:10:39.828792 
Table of lock wailited on : ORDERS 

Schema of lock walited on : DB2INST]1 


Tablespace of lock waited on : USERSPACE] 
Type of lock: Row 
Mode of lock: NS = Share (and Next KeY Share) 
Mode application reduested on lock: X —- Exclusilive 
Node Jock occured on: 0 
Lock object name: 782 
Application Handle: 298 
Deadlocked statement: 

Type : Dynamic 

Operation: Execute 

Section : 34 

Creator : NULLID 
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Package : SYSSN300 


CUIrSor : SOL CURSN300cC34 
Cursor was blocking: FALSE 
下 -UPDATE QBRDERS SET TOTALTRIX— 2 TOTNESALIFEING™— ?7 [OCKED— 2- 


TOTALTAXSHIPPING = ?3, STATUS = 2?, FIELD2 = ?3, TIMEPLACED = 2?, FIELD3 = 2?, CURRENCY 

= 3, SEQUENCE = 323, TOTALADJUSIMENT = 33, ORMORDER = ?3, SHIPASCOMPLETE = 3, 

PROVIDERORDERNUM = 2, TOTALPRODUCT = 23, DESCRIPTION = ?3, MEMBER ID = 2,， 

ORGENTITY ID = 23, FIELDI = ?3, STOREENT ID = 2?, ORDCHNLTYP ID = ?3, ADDRESS ID 

= 3, LASTUPDATE = ?33, COMMENTS = ?3, NOTIFICATIONID = ?3 WHERE ORDERS TD = > 
List of Locks: 


LoCck Name : OQx000201350000030E0000000052 
Lock Attributes : Ox00000000 

Release Fla3gs : Ox40000000 

LOCk Count = 

Hold Count = 

Lock Object Name 782 

Object Type : ROW 

Tablespace Name : USERSPACEL 

Table Schema : DB2INSTL 

Table Name : ORDERS 

Mode ”又 一 ExcClUsIive 

TOCK Name : OQx00020040000029B30000000052 
Lock Attributes : Ox00000020 

Release Elags : Ox40000000 

LOCk Count :4 

Hold Count -用 

Lock Object Name = 

Object Type : Row 

Tablespace Name : USERSPACEL 

Table schema : DB2INST]1 

Table Name : BKORDITEM 

Mode : 久 一 Exclusive (了 略 去 后 面 信息 ) 


也 可 以 使 用 专门 的 死 锁 事件 监控 器 ， 如 采用 5.4.3 节 中 的 locking 事件 监控 器 ， 这 种 锁 
事件 监控 融 不 仪 可 以 记录 锁 超时 事件 信息 ， 同 时 也 记录 死 锁 的 事件 信息 。 


3. db2pd 监控 锁 
图 5-16 展示 了 用 于 锁 监 视 的 db2pd 选项 。 


Iocks 
TrankHdl database—0atabhase tle=fllename showlocks= walt 
alldatabase 


图 5-16 用 于 锁 监 视 的 db2pd 选项 
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e TranHdl: 用 于 指定 事务 句柄 ， 以 便 只 监视 由 特定 事务 持 有 的 锁 。 

e Showlocks: 这 个 于 选项 将 锁 的 名 称 扩 展 成 有 意义 的 解释 。 对 于 行 锁 ， 该 选项 显示 
以 下 信息 : 表 宇 间 D、 表 ID、 分 区 ID、 员 和 模 。 通 过 使 用 编目 视 风 SYSCAT.TABLES 
上 的 查询 ， 可 以 很 容易 将 表 衬 间 ID 和 表 JID 映射 到 相应 的 表 名 。 

下 面 展示 了 检查 锁 等 竺 的 情形 : 


db2pd —db sample =1ocks walt showlocks 


Database Partition 0 -- Database SAMPLE -- Active -- Up 3 days 08:33:05 
LOCcks: 

(二 [第 站 本寺 1 TranHdl Lockname Type Mode Sts Owner Dur 
0x050A0240 6 02000600050040010000000052 ROW -2 1 
0x0I0A0DBO 2 02000600053004001]10000000052 ROW EN ] 


HoldCount Att ReleaseF19 
0 Ox00 0x40000000 TbspaceID 2 TableID 6 PartitionID 0 Page 320 Slot 5 
0 0x00 0x40000000 TbspaceID 2 TableID 6 PartitionID 0 Page 320 Slot 5 


5.8 最 大 化 并 发 性 


对 于 好 的 数据 库 性 能 来 说 ， 最 大 化 并 发 性 非 音 重要 。 下 面 列 出 了 一 些 详细 的 建议 。 
5.8.1 选择 合适 的 隔离 级 别 

选择 隔离 级 别 可 以 为 应 用 程序 提供 可 接受 的 最 佳 并 发 性 。 有 几 种 方式 可 用 来 指定 隔离 
级 别 ， 比 如 对 SQL 语句 (只 应 用 于 该 语句 ) 使 用 CURRENT ISOLATION 专用 寄存 苍 ( 应 用 于 
连接 )， 对 JDBC 连接 对 象 进行 指定 (应 用 于 连接 ) 等 。 
5.8.2 ”尽量 避免 锁 等 簿 、 锁 升级 和 死 锁 

通过 监控 锁 升 级 的 发 生 ( 通 过 DB2 状态 监控 器 、db2diag.log、Windows 事件 浏览 器 或 
其 他 性 能 监控 器 )， 确 保 锁 列表 和 MAXLOCK DB2 配置 参数 足够 大 。 锁 列表 大 小 不 足 将 会 
导致 DB2 党 试 将 大 量 行 锁 “ 升 级 ”到 单个 表 级 别 的 锁 。 如 果 升 级 失败 ， 就 会 导致 死 锁 ; 如 
果 升 级 成 功 ， 又 会 极 大 地 影响 到 并 发 性 。 
5.8.3 ”设置 合理 的 注册 变量 

可 以 通过 使 用 3 个 DB2 注册 变量 一 一 DB2 EVALUNCOMMITTED、 DB2 SKIPDELETED 
和 DB2 SKIPINSERTED 来 提高 并 发 性 。 如 果 不 设置 这 三 个 注册 变量 ， 当 用 户 正 在 更 改 
(update)、 插 入 (inserb 或 删除 (delete) 一 行 时 ，DB2 会 在 这 一 行 加 上 排 它 锁 (eXclusive)， 别 的 
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用 户 不 能 谈 写 ， 除 非 使 用 UR 隔离 级 别 。 

其 实 ， 目 前 市 场 上 除了 Oracle 外 所 有 的 数据 库 ， 包 括 DB2、Informix、SQL Server 和 
Sybase, 对 钞 的 控制 都 是 这 种 方式 .而 Oracle 因为 有 回 深 段 (rollback segment), 所 以 在 Oracle 
数据 库 中 对 于 insert 一 行 ， 回 深 段 记录 插入 记录 的 rowid; 对 于 update 操作 ， 回 深 段 记录 更 
新 衬 段 的 上 昌 什 (before image); 对 于 delete 操作 ， 回 深 段 记录 整 行 的 数据 。 由 于 Oracle 有 了 
回 滚 段 ， 因 此 可 以 实现 多 版 本 谈 。 上 所 以 在 用 Oracle 数据 库 开 发 时 ， 很 少 关 注 锁 的 情况 ， 因 
为 大 部 分 情况 下 你 都 是 可 以 恋 的 ， 只 不 过 有 的 时 候 大 不 了 读 以 前 的 “before Image” 叶 了。 
所 以 很 多 使 用 Oracle 开发 的 用 户 在 转向 DB2 开发 时 ， 都 特别 郁闷。 而 DB2 为 了 改善 应 用 
程序 并 发 性 ， 就 陆续 引入 了 这 3 个 变量 。 这 3 个 变量 并 不 会 改变 锁 的 本 质 ， 只 不 过 是 了 解 
它们 的 工作 方式 和 机 制 ， 以 使 我 们 根据 业务 多 辑 来 合理 地 设置 调整 以 提高 应 用 程序 的 并 发 
性 。 这 3 个 变量 在 实现 原理 上 和 DB2 V9.7 新 加 的 参数 CUR_COMMIT 是 完全 不 同 的 ， 并 
日 在 CUR COMMIT 为 ON 的 时 候 ， 会 缆 闸 该 参数 包含 的 大 部 分 场景 ， 因 此 在 下 面 的 例子 
里 ， 我 们 将 CUR COMMIT 修改 为 DISABLED。 

下 面 我 们 先 通过 一 个 例子 来 说 明 没 有 这 3 个 变量 之 前 的 一 些 锁 的 情况 。 假设 tl 表 中 有 
5 条 记录 ， 分 别 为 11、22、33、44、55。 其 中 第 2 条 记录 22 被 删除 了 ， 现 在 session1 要 重 
淅 插入 一 条 新 的 记录 22; 同时 session 2 执行 了 db2 select * from tl where id >11 and id=44， 
正常 的 话 应 该 检索 到 33 这 条 记录 ， 但 是 由 于 现在 插入 的 记录 22 也 包含 在 这 个 谓词 的 限定 
沁 围 内 ， 这 个 时 候 session 2 处 于 锁 人 等 待 状态 。 


Sesslon 1 Sesslon 2 
db2 CONNECT TO SAMPLE db2 CONNECT TO SAMPLE 
db2 +c "INSERT INTO 七 1] VALUES(22)} " db2 "SELECT * FROM tl1 WHERE 1Q >11 


and 1G <44" 


我 们 通过 号 探 看 到 的 效 坟 如 图 5-17 所 示 。 


国 19711372a8 而 二 属 1 图 157 em or At ， 二 .EE Te 
| 上 上 aier iT kele Fly Edn Vr QOpewoemy Treng Srpt Too Heip | Fin Ed "View Cwbppms Treaber font 
到 习 吕 可 加 的 | 二 忆 呈 | 本 菇 站 | 司 站 到 刘 | 二 汕 的 | 本 号 呈 要 复生 攻 虽 浊 辐 : 汕 的 和 加 时 这 全 后 
| 本 | | | | [5 
receghost3: /home/dbirb$db? “select * from tl ||ycghost3: /home/db2rb$db2 “select 中 from tl lily ee std: /home/ db2rb$db2 list applications 
» where id>ll end ig*44" i» show detnail | grep =i lock 
ID ||pBg2zB 
1] | db2bp 
4 | 22 sLOCAL, abasbe, e1009011131 
44 ti 
J 
| lL ect - 
d reeord(ls) selected. lome/db2zb/ di 27b/ x0 DEO 000 SOLO0001 
村 | 
egEhost: 1 J db2rb$db2 +e "ingert into t) 
DB2 00 pol ‘The ee i Completed Successll 
tr /home, db 


图 5-17 监控 结果 


从 DB2 的 角 虔 ap 理 的 , 但 是 从 用 户 和 业务 逻辑 的 角度 来 说 , 希望 这 个 时 
候 能 够 谈 取 到 数据 ， 那 么 怎么 解决 这 个 下 眉 呢 ? 下面 我 们 来 仔细 讲解 这 3 个 变量 。 
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DB2 EVALUNCOMMITTED 


当 启 用 了 DB2 EVALUNCOMMITTED 这 个 DB2 注册 变量 (=TRUE | ON | YES | 1) 时 ， 
它 将 修改 DB2 中 只 读 人 三 询 的 行为 ， 使 之 允许 在 索引 扫 插 (必须 是 type-2 索引 ， 对 于 type-1 
索引 该 特性 不 受 文 持 ) 或 表 访 问 时 推 返 锁 ， 直 到 限定 语句 的 所 有 谓词 都 是 已 知 的 。 这 个 注册 
变量 是 为 了 可 选 地 提高 一 些 应 用 程序 的 并 发 性 ， 其 实质 是 允许 谈 扫 摘 推 运 或 避免 行 锁 ， 直 
到 适合 特定 合 询 的 某 条 数据 记录 成 为 已 知 。 

如 果 没 有 设置 这 个 注册 变量 ，DB2 将 执行 保守 式 的 锁 : 在 验证 行 是 否 满足 查询 的 排除 
谓词 之 前 ， 将 锁定 每 个 被 访问 的 行 。 不 管 数 据 行 是 否 被 提交， 以 及 根据 语句 的 谓词 是 否 衫 
排除 ， 对 于 索引 扫 摘 和 表 访 问 都 执行 这 样 的 锁定 操作 。 下 面 我 们 举 一 个 向 单 的 例子 : 


db2 create table td 1nt) 
db2 insert nto tl valuest{11) 
db2 commit 


现在 有 两 个 会 话 分 别 发 出 了 下 面 的 SQL 语句: 


Session 1 Sesslon 2 


db2 CONNECT TO SAMPLE 


db2 CONNECT TO SAMPLE 
do +c "INSERT INTO Tl VALUES (22}™" 


db2 "SELECT * FROM 七] WHERE 1d = 11™ 
全 看 Session 2 的 状态 ， 如 图 5-18 所 示 。 
第 一 条 语句 DB2 +C "INSERT INTO TABLE T1 VALUES (22) "阻塞 所 有 其 他 的 扫描 
做 ， 因 为 它 持 有 行 上 的 锁 ;， 如 果 第 二 个 会 话 执 行 DB2 "SELECT * FROM IT1"， 那 么 将 被 阻 
塞 ， 直 到 事务 1 提交 或 回 深 。 但 是 假设 第 二 条 语句 是 DB2 "SELECT * FROM T1 WHERE 
id=11"。 在 此 情况 下 ,即使 事务 2 与 列 ID=22 中 的 任何 值 (还 没有 被 提交 ) 都 没有 关系 ， 也 仍 
将 被 阻 罕 ， 处 于 锁 等 得 状态 。 在 DB2 中 ， 默 认 情 况 下 将 发 生 这 一 系列 的 事件 ， 因 为 默认 的 
隔离 级 别 是 Cursor Stability(CS)。 这 种 隔离 级 别 表 明 , 碍 询 访问 的 任何 一 行 在 游标 定位 到 该 
行 时 都 必须 被 锁定 。 在 语句 1 释放 用 于 更 新 表 tl 的 锁 之 前 ， 语 名 2 不 能 包含 表 1l 第 一 行 
上 的 锁 。 如 果 DB2 知道 值 ID=11 不 是 语句 2 的 数据 请 求 的 一 部 分 ( 换 句 话说， 在 锁定 行 之 
前 计算 了 谓词 )， 束 可 以 避免 阻塞 ， 这 是 合情合理 的 ， 因 为 语句 2 不 会 尝试 锁定 表 中 的 第 
= 
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图 197.3.137.248 | 


File Edit View QOQptions Transfer Script Tools Help 

漳 习 自负 况 | 时 包 前 | 号 马扎 | 力 第 | 全 | 国 上 

| 197.3.137.248 
lycghost3: /home/db2zb$db2 +c "INSERT INTO tl VALUES(22)" 
DB20000TI The SQL command completed successfully. 
ycghost3: /home/db2zb 罩 


Ready ssh2: AES-256-CTR 3 22 5Rows 6Cols Xterm CAP NUM  ， 


| | 197,3,137,248 


ycghost3: /home/db2zrb$db2 “SELECT *# FROM tl WHERE id = 11" 


Ycghost3: /home/ db2zb$db? 1ist applications show detail 


DH22B 


*LOCAL. db2zb. 121009011137 
0 8741 
Collected SAMPLE 
ycghost3: /home,db2zbs 


图 5-18 ”Session 2 的 状态 


现在 启用 DB2 EVALUNCOMMITTED 注册 变量 ， 实 例 设 置 后 需要 重启 : 


db2set DB2 EVALUNCOMMITTED=ON 
dh2stop force 
db2start 


在 局 用 实例 后 , 重复 刚才 的 实验 , 会 发 现 第 二 条 SQL 语句 “select * from tl where id=11” 
可 以 执行 而 不 会 被 阻塞 。 所 以 DB2 EVALUNCOMMITTED 注册 变量 的 作用 是 判断 SQL 请 
词 扫 插 的 行 是 否 有 锁 。 如 果 没 有 ， 那 么 可 以 检索 到 数据 。 


DB2 EVALUNCOMMITTED 注册 变量 有 以 下 上限 


制 |: 

必须 启用 DB2 EVALUNCOMMITTED 注册 表 变 量 。 

隔离 级 别 必须 是 CS 或 RS。 

行 级 别 锁定 生效 。 

存在 控制 求 值 谓词 。 

未 落实 数据 求 值 功能 不 适用 于 对 系统 目录 表 执 行 的 扫描 。 

对 于 多 维 集群 (MDC) 或 插入 时 间 集 群 IGTC) 表 ， 可 以 对 索引 扫描 延迟 块 级 锁定 ; 但 
是 ， 不 能 对 表 扫 描 延 迟 块 级 锁定 。 

对 于 正在 执行 原 位 置 表 重 组 操作 的 表 ， 不 会 发 生 锁定 延迟 。 


221 


a2 


DB2 数据 库 性 能 调整 和 优化 (第 3 版 ) 


e 对 于 索引 扫 揪 访 存 方案 而 癌 ， 不 会 将 行 级 别 锁定 延迟 到 数据 访问 期 间 进行 ， 而 是 ， 
在 移 全 表 中 的 共 行 之 前 在 索引 访问 期 间 锁定 该 行 。 
e 在 表 扫 描 期 间 将 无 条 件 地 跳 过 已 删除 的 行 ， 但 仅 当 DB2 SKIPDELETED 注册 表 
变量 处 于 局 用 状态 时 ， 才 会 跳 过 已 删除 的 索引 键 。 
DB2 EVALUNCOMMITTED 变量 影响 DB2 在 游标 稳定 性 (CS) 和 读 稳定 性 RS) 隔离 级 
别 下 的 行 锁 机 制 。 当 局 用 该 功能 时 ，DB2 可 以 对 未 提交 的 插入 (INSERT) 或 更 新 (UPDATE) 
数据 进行 谓词 判断 。 如 果 未 提交 数据 不 符合 该 条 语句 的 谓词 判断 条 件 ，DB2 将 不 对 未 提交 
数据 加 锁 ， 这 样 避 免 了 因为 要 对 未 提交 数据 加 锁 而 引起 的 锁 等 竺 状态， 提高 了 应 用 程序 
访问 的 并 发 性 。 同 时 ，DB2 在 无 条 件 进行 表 扫 摘 时 会 忽略 删除 的 行 数据 (不 管 是 否 提交 )。 
这 里 分 两 部 分 来 看 待 ,“ 对 于 插入 (NSERT) 或 更 新 (UPDATE) 而 言 ， 如 果 未 提交 数据 不 
符合 该 条 语句 的 谓词 判断 条 件 , 那 么 DB2 将 不 对 未 提交 数据 加 锁 风 这 样 昌 然 比 不 上 Oracle 
对 于 符合 该 条 语句 的 谓词 判断 条 件 可 以 从 回 深 段 里 面谈 出 “before image” 那 样 做 到 与 不 阻 
止 旋 ， 但 是 起 人 码 在 一 定 程 度 上 绥 解 了 锁 的 问题 ， 不 会 因为 插入 (INSERT) 或 更 新 (UPDATE) 
一 条 记录 造成 整个 表 都 锁 住 。 这 是 个 进步 ， 也 不 会 造成 什么 大 的 负面 影 啊 ， 
下 和 面 我 们 通过 一 个 实验 来 说 明 这 点 : 
db2 create Table tltrd nt) 
dD2 ™iTrnsert Tnto tl valies{r1l}" 


dD2 nsert 1nto tl1 values (22)" 
db2 commit 现在 表 中 有 了 两 条 记录 11 和 22 


现在 两 个 会 话 发 出 了 下 面 的 SQL 语句 : 


SesslLon 1 SesslLon 2 
db2 CONNECT TO SAMPLE CONNECT TO SAMPLE 
db2 +c “delete from tl1 Where 1d=22" db2 "SELECT * FROM 七 1” 


在 未 设置 DB2 EVALUNCOMMITTED=ON 时 ，Session 2 肯定 处 于 锁 等 待 状态 ， 在 设 
置 了 DB2 EVALUNCOMMITTED=ON 后 ， 再 来 看 看 Session 2 能 否 检索 到 数据 : 


Sesslon 1 Sesslon 2 
db2 CONNECT TO SAMPLE 
Sth2 select * from EE" 
db2 CONNECT TO SAMPLE TD 
db2 +c "delete from t1 Where 1d=22™ 一 一 一 一 一 一 一 一 一 一 一 
| 
1 条 记录 已 选择 


通过 上 面 的 实验 ， 我 们 发 现在 启用 DB2_ EVALUNCOMMITITED=ON 时 ， 对 于 删除 操 
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作 的 处 理 ，DB2 会 无 条 件 地 在 进行 表 扫 接 时 忽略 删除 的 行 数据 (不 管 是 侍 提 区 )。 个 人 和 宽 得 


有 很 大 的 问题 ， 通 过 上 面 的 这 个 测试 ， 一 个 事务 删除 一 条 记录 并 没有 提交 ， 故 


询 的 时 候 已 经 没有 这 条 记录 了 ， 这 相当 于 UR 隔离 级 别 。 这 样 显然 是 


个 符合 


业务 要 求 的 ， 


一 个 会 话 查 


与 其 这 样 还 不 如 锁 住 。 所 以 使 用 DB2 EVALUNCOMMITTED=ON 时 ， 删 除 的 时 候 应 该 注 


现在 ， 在 创建 type-2 索引 ， 册 来 做 刚才 的 那个 实验 : 


db2 "create index i1ndexll on tid)" 


在 两 个 命令 行 窗口 (如 图 5-19 所 示 ) 中 分 别 发 出 下 面 的 SQL 语句: 


Session 1 Sesslilon 2 


db2 CONNECT TO SAMPLE 
dbh2 create 1ndex indexll on 十 1 {1d) 


db2 +c "delete from tl1 where id=22" -- 锁 等 待 挂 起 


db2 CONNECT TO SAMPLE 
dh? "select * from 七 1” 


我 们 在 另 一 个 窗口 中 查看 Session 2 的 状态 , 发 现 Session 2 处 于 锁 等 待 状态 , 如 图 5-19 


所 示 。 
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lIycghost3: /home/db2zb$db2 +c "delete from tl where id=22" 
DB20000I The SQL command completed successfully. 
Nycghost3: /home/ db2zb$ 


ssh2: AES-256-CTR 3 22 5Rows, 76 Cols Xterrm 


CAP NUM 


a ‘home/db2zb$db2 “select 站 from t1" 


Fille Edit ee Options Transfer Script Tools Help 


镁 习 加 加 凋 | 全 本 的 | 吗 呈 马 | 本 做 人 | 四 | 羡 目 


| 1 197.3.137.248 | 


DB22B 


ycghost3: /home/db2zb$ 国 


图 $-19 ”实验 结果 


vcghost3:, /home/ db2zb$db? list applications show detail grep -1 lock 


22 
00001 1 


db2bp 
*LOCAL. db2zb. 121009013225 | 
0 8741 
Collected SAMPLE “homeydb2zby db2zbyNODE00007SQL0O00017 
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当 DB2 环境 中 局 用 了 Evaluate Uncommitted 行为 时 ， 你 应 该 清楚 ， 谓 词 计算 可 能 发 生 在 
未 提交 的 数据 上 。 而 且 在 表 扫 描 访问 中 ， 删除 行 被 无 条 件 忽 略 ， 而 对 于 type-2 索引 扫描 ， 被 
删除 的 键 不 会 被 忽略 (除非 你 还 设置 了 DB2 SKIPDELETED 注册 变量 ，DB2 SKIPDELETED 
变量 我 们 在 稍 后 介绍 )。 如 果 要 在 于 境 中 单独 设置 DB2 SKIPDELETED 注册 变量 ，DB2 将 
允许 在 表 扫 描 访 问 时 无 条 件 地 忽略 被 删除 行 ,并 忽略 type-2 索引 扫 摘 访问 的 伪 删 除 索 
引 键 。 


DB2 SKIPDELETED 


变量 DB2_SKIPDELETED( 锐 局 用 时 =ON) 将 允许 使 用 Cursor Stability 或 Read Stability 
隔离 级 别 的 语句 ， 在 索引 扫 搬 期 间 无 条 件 地 跳 过 被 删除 的 键 ， 而 在 表 访 问 期 间 则 无 条 件 地 
跳 过 被 删除 的 行 。 当 DB2 EVALUNCOMMITTED 被 启用 时 ， 被 删除 的 行 会 被 自动 跳 过 ， 
但 是 除非 同时 启用 了 DB2 SKIPDELETED， 和 否则 type-2 索引 中 未 提交 的 伪 删 除 键 不 会 被 
味 6 过 。 

在 上 面 的 实验 中 ， 我 们 发 现 当 设置 了 DB2 EVALUNCOMMITTED 变量 时 ， 如 果 表 上 
有 type-2 索引 ， 那 么 在 读 取 数据 时 ， 被 删除 的 索引 键 不 会 被 忽略 。 这 种 情况 下 如 果 布 望 跳 
过 被 删除 的 键 ， 可 以 通过 设置 DB2 SKIPDELETED=ON 来 实现 ， 下 面 我 们 做 个 实验 : 


db2set DB2 SKIPDELETED=ON 
db2stop force 
db2start 


设置 生效 后 ， 我 们 接 看 做 刚才 的 实验 : 


Session 1 Sesslon 2 
db2?2 CONNECT TO SAMPLE 
db2? "Select * from 七 1” 


db2? CONNECT TO SAMPLE TD 
db2 creale ndex dexll Gn Etan 
db2 +c "delete from tl1 where 1d=22" 1 

1 条 记录 已 选择 


可 以 看 到 在 设置 DB2 SKIPDELETED=ON 后 ， 即 使 1 表 上 有 type-2 索引 ， 在 扫描 的 
时 候 也 仍然 包 略 这 个 删除 的 行 。 但 是 这 在 用 的 时 候 一 定 要 结合 业务 逻辑 使 用 ， 因 为 这 种 情 
况 下 等 同 于 “ 脏 读 ”， 所 以 一 定 要 多 测试 。 
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DB2 SKIPINSERTED 


虽然 当 一 行 由 于 未 提交 的 INSERT 而 被 锁 住 的 时 候 ， 这 种 行为 是 正确 的 ; 但 是 有 些 情 
况 下 应 用 程序 的 所 有 者 布 望 DB2 忽略 正在 等 得 提交 的 被 插入 的 行 ,就 好 像 它 不 存在 一 样 (由 
于 未 提交 INSERT 的 提交 版 本 现在 根本 没有 行 ， 因 此 这 是 可 能 的 )。 例如， 银行 在 下 午 5 点 
左右 想 统计 今天 的 业务 量 ， 这 时 只 是 想 了 解 大 概 的 业务 量 而 不 是 精确 的 ， 这 种 情况 下 如 末 
局 用 该 变量 ， 那 么 遗漏 一 两 笔 业务 是 可 以 接受 的 。 

DB2 SKIPINSERTED-OFF 是 默认 设置 ,这 使 得 DB2 的 行为 和 预期 的 一 样 : 扫描 妖 一 
直 等 到 INSERT 事务 提交 或 回 深 ， 然 后 返回 数据 一 一 这 和 平常 一 梓 ， 取 决 于 应 用 程序 以 及 
和 业务 逻辑 相关 的 数据 完整 性 的 特征 ， 这 样 可 能 合适 ， 也 可 能 不 合适 。 例 如 ， 考 上 处 涉 及 两 
个 应 用 程序 的 业务 流程 一 一 例如 ， 信 用 评级 应 用 程序 和 信用 评分 引擎 ， 这 两 个 应 用 程序 使 
用 相同 的 表 来 交换 业务 信息 。 应 用 程序 A 基于 Web 表单 将 数据 插入 数据 库 ， 应 用 程序 B 
读 这 些 数据 。 为 了 加 快 信用 审批 的 速度 ， 候 选 者 通过 信用 评级 应 用 程序 表单 转移 ， 信 息 块 
通过 表单 中 的 'Steps' 被 发 送 到 应 用 程序 B( 通 过 公共 的 表 )。 当 候选 者 完成 信用 评级 应 用 程序 
流程 中 的 每 个 步骤 时 ， 信 息 被 发 送 。 在 这 个 环境 中 ， 数 据 必须 由 第 二 个 应 用 程序 按照 表 中 
给 出 的 顺序 来 处 理 , 以 便当 接 下 来 要 谈 的 行 要 被 应 用 程序 A 插入 时 , 应 用 程序 B 必须 等 竺 ， 
直到 INSERT 被 提交 。 

如 果 设 置 DB2 SKIPINSERTED=ON,DB2 将 把 未 提交 的 INSERT( 只 对 于 CS 和 RS 陋 
离 级 别 ) 看 作 它 们 还 没有 被 插入 。 该 特性 提高 了 并 发 性 ， 同 时 又 不 牺牲 隔离 语义 。DB2 为 
扫 摘 需 实 现 了 这 种 能 力 ， 通 过 锁 属 性 和 锁 请 求 的 反 饿 ， 使 其 忽略 未 提交 的 插入 行 ， 而 不 是 


下 面 我 们 举 一 个 设置 DB2 SKIPINSERTED 变量 前 后 的 例子 ; 


Session 1 Sesston 2 

db2 CONNECT TO SAMPLE db2 CONNECT TO SAMPLE 
UB2 "create ndax ndexlLl on tiidy" db2 Select * from EE 
db2 +C "INSert nto tl values(?33y" -- 挂 起 ， 处 于 锁 等 待 状 态 


通过 监控 发 现 Session 2 处 于 锁 等 竺 状态， 如 图 5-20 所 示 。 
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忆 197.3.137.248 PP- Eee = 


| Fle Edit View OQptions Te Script Tools He 

| | 197.3,137.248 | 
ycghost3: /home/db2zb$db2 “create index indexll on t1(id)" 
DB20000] The SQL command completed successfully. 
vcghost3: /home/db2zb$db2 +c "insert into tl values (33)" 
DB20000I The SQL command completed successfully. 一 
vcghost3: /home/db2zb$ 


ssh2: AES-256-CTR 5, 22 5Rows, 76Cols Xterm CAP NUM : 


二 一目 | 
-上 


= 可 Bl 2 
id 一 大 E 和 蕊 一: 


| | 197.3,137,248 


回 
ycghost3:/home/db2zb$db2 “select * from tl1" -| 


。 EE a Eee ed 
7 SS 
File Edit View Options Transfer Script Tools Help 
| 演习 加 悦 蜀 书 避 角 器 凡 马 轨 庆 和 和 @ 国 E 
| 1 197.3.137.248 


ycghost3: /home,/db2zb$db2 list applications show detail grep -1 lock < 
DB2ZB 


db2bp 22 
00003 1 
Not 


LOCAL. db2zb. 121009013225 
0 8141 ralt 
Collected SAMPLE /home/db2zb/dbszb/NODEO000/SQLOO001/ 
ycghost3: /home/db2zb$ 上 


iRead ssh2: AES-256-CTR 7 22 8Rows 77Cols Xterm CAP NUM 


图 5-20 Session 2 的 状态 


如 果 在 这 种 情况 下 Session 2 希望 能 够 跳 过 未 提交 INSERT 的 数据 而 得 到 数据 , 那么 可 
以 设置 DB2 SKIPINSERTED 注册 变量 : 


db2set DB2 SKIPINSERTED=ON 
db2stop force 
db2start 


然后 重复 刚才 的 实验 ， 我 们 发 现 这 个 时 候 ，Session 2 可 以 读 到 数据 。 


Sesslon 1 Sesslon 2 
dBz “select  * from 1 
db2?2 CONNECT TO SAMPLE TD 
db2 "create index indexll on tl1(1d) mm 一 一 -一 一 一 一 一 一 一 一 
db2 :+c "1nsert Into tl valunes(t33)™" 11 
22 


2 条 记录 已 选择 。 
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5.9 本章 小 结 


总 的 来 说 , 这 3 个 注册 变量 会 影响 到 并 发 性 。 通过 合理 设置 这 些 变 量 可 以 改善 并 发 性 ， 
但 是 也 会 影响 到 应 用 程序 的 行为 。 建 议 在 DB2 开发 设计 的 初期 启用 这 些 注册 变量 ， 从 而 在 
实现 并 发 性 增强 后 执行 全 面 测试 中 的 所 有 单元 测试 。 

通过 设置 这 3 个 注册 变量 ， 可 以 提高 并 发 性 ， 但 是 使 用 的 时 候 一 定 要 结合 目 己 的 业务 逻辑 
来 使 用 。 根据 个 人 经 验 ， 建议 使 用 DB2 EVALUNCOMMITTITED=ON 和 DB2 SKIPINSERTED= 
ON。 对 于 DB2 SKIPDELETED 变量 来 说 ， 使 用 的 时 候 一 定 要 充分 地 测试 ， 因 为 这 等 同 于 
使 用 UR 隔离 级 别 (虽然 DB2 SKIPINSERTED=ON 也 等 同 于 UR， 但 是 没有 插入 的 数据 反 
正 也 没有 插入 ， 读 不 到 在 业务 上 是 可 以 接受 的 )。 

总 之 ， 有 了 这 3 个 变量 ， 我 们 多 了 一 种 选择 ， 这 总 比 没有 强 。 目 前 这 3 个 变量 都 是 实 
例 级 别 的 变量 ， 如 果 能 做 成 SQL 级 别 或 应 用 级 别 的 就 更 好 了 。 期 每 DB2 能 够 在 后 续 的 版 
本 中 继续 对 并 发 做 出 改进 。 
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索引 是 数据 库 性 能 优化 的 第 一 关 ， 本 号 的 特点 使 得 它 深 受 大 家 的 喜爱 


索引 设计 与 优化 


效 快 。 无 论 是 高 手 还 是 全 乌 ， 一 般 都 会 深 深 受益 于 索引 。 一 个 合适 的 索引 ， 能 使 数据 库 性 
能 提升 几 倍 ， 甚 至 几 十 倍 、 几 百倍 也 不 足 为 奇 。 
本 章 主 要 讲解 如 下 内 容 : 


6.1.1 


索引 概念 

索引 的 结构 

索引 访问 机 制 

索引 设计 

索引 创建 原则 与 示例 
影响 索引 性 能 的 相关 配置 
索引 维护 

使 用 db2advis 调整 索引 
索引 调整 总 结 


索引 概念 


这 引 优点 


肥 引 是 表 的 一 个 或 多 个 列 的 键 值 的 有 序列 表 
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e 确保 一 个 或 多 个 列 中 值 的 唯一 性 。 
e 提高 对 表 进 行 查 询 的 效率 。 当 执行 查询 ， 想 以 更 快 的 速度 找到 所 需 的 记录 ， 或 者 
想 对 表 里 的 数据 进行 排序 查询 时 ，DB2 优化 器 会 选择 使 用 合适 的 索引 。 

如 果 表 上 不 存在 索引 ， 那 么 必须 对 SQL 查询 中 引用 的 每 个 表 执 行 全 表 扫 描 。 表 中 记 
录 数 越 多 ， 每 条 记录 越 长 ， 全 表 扫 摘 花 费 的 时 间 越 长 ， 因 为 全 表 扫 描 需 要 顺序 访问 表 中 所 
有 的 行 。 虽然 对 于 需要 表 中 大 多 数 记 录 的 查询 来 说 ， 使 用 表 扫 描 效 率 可 能 更 高 ， 但 对 于 只 
返回 表 中 部 分 记录 的 答 询 ， 索 引 扫 描 可 以 更 有 效 地 访问 表 中 的 数据 。 

如 果 在 SELECT 语句 中 引用 了 索引 列 且 优 化 器 估计 索引 扫描 比 全 表 扫 描 快 ， 那 么 优 
化 器 选择 索引 扫描 。 索 引 对 应 的 数据 页 相对 较 少 ， 因 为 一 般 情 况 下 ， 款 引 都 只 包含 表 的 部 
分 列 ， 因 此 读 取 它 所 需 的 时 间 比 读 取 整 个 表 所 需 的 时 间 要 少 ， 尤 其 在 表 很 大 时 更 是 如 此 。 

如 果 对 输出 的 排序 需求 可 以 与 索引 列 相 匹配 ， 那 么 查询 时 将 不 需要 再 次 对 表 中 的 数据 
进行 排序 。 

每 个 索引 条 目的 包含 搜索 键 值 和 指 癌 包含 该 值 的 行 的 指针 。 如 果 在 CREATE INDEX 
语句 中 指定 了 ALLOW REVERSE SCANS 人 参数， 那么 可 以 按 升 序 和 降序 搜索 这 些 值 。 

除 搜索 键 值 和 行 标识 外 (row id)， 索 引 还 可 以 包含 非 索引 列 。 这 样 的 列 有 可 能 使 优化 器 
仅 从 索引 获取 所 需要 的 信息 ， 而 不 必 访 问 表 本 号 。 


注意 : 
要 查询 的 表 上 存在 索引 并 不 保证 结果 集 已 排序 ， 只 有 ORDER BY 子 句 才 确 保 结果 集 
的 排序 。 


尽管 索引 能 显著 缩短 访问 时 间 , 但 在 少数 情况 下 , 它们 也 可 能 会 给 性 能 带 来 负面 影响 ， 
所 以 要 避免 创建 没 意 义 的 索引 ， 在 创建 索引 之 前 ， 考 虑 多 个 索引 给 磁盘 空间 和 处 理 时 间 瑚 
来 的 影响 。 

每 个 索引 都 需要 存储 器 或 磁盘 空间 。 准 确 的 容量 取决 于 表 中 的 记录 数 以 及 索引 包含 的 
列 的 大 小 和 数目 。 

对 表 执 行 的 每 个 INSERT 或 DELETE 操作 都 需要 对 表 上 的 每 个 索引 进行 额外 的 更 
新 。 对 于 更 改 索引 键 值 的 每 个 UPDATE 操作 ， 也 是 如 此 。 

LOAD 实用 程序 重建 任何 现 有 的 关系 索引 或 追加 至 现 有 的 关系 索引 之 后 。 可 在 LOAD 
命令 中 指定 MODIFIED BY indexfreespace 参数 以 黎 兰 创建 索引 时 使 用 的 索引 PCTFREE 值 。 

每 个 关系 索引 都 有 可 能 对 SQL 符 询 添加 备用 访问 路 径 以 供 优化 器 考 层 ， 这 会 增加 有 
译 时 间 ， 因 此 需要 谨慎 选择 索引 来 满足 应 用 程序 的 需要 。 

注意 : 

关系 索引 是 相对 于 XML 索引 而 言 的 ， 所 以 关系 索引 就 是 常规 索引 ， 也 就 是 通常 意义 
上 的 索引 。 
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6.1.2 索引 类 型 
1. 唯一 索引 与 非 唯 一 索引 


索引 | 可 以 定义 为 唯一 的 或 非 唯 一 的 。 非 唯一 的 索引 允许 重复 的 键 值 ， 唯 一 的 索引 只 多 
许 东 种 键 值 的 组 合 出 现 一 次 。 虽 然 NULL 值 代 表 未 知 ， 但 唯一 索引 只 允许 出 现 一 次 NULL 
值 。 索 引 是 使 用 CREATE INDEX 语句 创建 的 。 为 文 持 主键 或 唯一 约束 ， 当 创建 主键 或 唯 
一 键 时 隐 式 地 创建 沦 引 。 当 创建 唯一 索引 时 ， 会 检 会 表 中 键 数 据 的 唯一 性 ， 如 来 友 现 重复 
的 键 数 据 ， 索 引 创 建 将 失效 。 索 引 可 以 创建 为 逢 到 、 降 序 或 双 同 。 选 择 哪 个 选项 取决 于 应 
用 程序 如 何 访问 数据 。 


2. 集群 系 引 


我 们 可 以 创建 集群 索引 来 为 表 中 的 行 排 序 ， 并 且 是 按照 万 需 结 果 集 的 物理 顺序 来 排 
序 。 集 群 索引 可 以 用 CREATE INDEX 语句 的 CLUSTER 选项 来 创建 。 为 获得 最 佳 性 能 ， 
应 该 在 那些 小 型 的 数据 类 型 (比如 整 型 和 char(10))、 具 有 唯一 性 的 列 ， 以 及 在 范围 搜索 中 经 
常 要 用 到 的 列 上 创建 集群 索引 。 

集群 容 引 允许 对 数据 页 采用 更 线性 的 访问 模式 ， 这 将 会 大 大 提 珊 沁 围 性 谓词 僵 询 的 效 
率 。 但 同时 意味 着 插入 操作 要 花 更 多 的 时 间 ， 因 为 不 仅 要 维护 索引 的 顺序 ， 还 要 维护 数据 
的 顺序 。 当 使 用 集群 索引 时 ,应 考虑 将 数据 页 和 索引 页 上 的 衬 末 空间 增加 为 大 约 15 到 35( 而 
不 是 PCTFREE 的 默认 值 10)， 进 而 允许 大 容量 的 插入 。 

集群 索引 的 好 处 包括 : 

e 在 每 个 数据 分 区 内 ， 数 据 页 以 键 的 顺序 排列 。 

e 集群 索引 改善 了 以 键 的 顺序 扫 摘 整 张 表 的 性 能 。 这 是 因为 扫 摘 访 存 第 一 页 的 第 一 

行 ， 然 后 访 存 同 一 页 上 的 每 一 行 ， 在 访 存 了 该 页 上 的 所 有 行 之 后 ， 才 移 全 下 一 页 。 
这 表示 任何 给 定时 间 内 都 只 需要 表 的 一 页 位 于 缓冲 池 中 。 相 反 ， 如 条 表 未 集群 ， 
那么 访 存 的 每 行 有 可 能 是 不 同 页 中 的 。 除 非 绥 神 池 中 有 空间 保存 整个 表 ， 人 否则 这 
会 寻 致 每 页 被 访 存 多 次 ， 从 而 极 大 地 减 慢 扫 摘 速 度 。 


6.2 索引 结构 


1. 标准 表 的 表 和 索引 管理 
图 6-1 显示 了 标准 表 的 逻辑 表 、 记 录 和 索引 结构 。 
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过 和 辑 表 视图 物理 表 视 图 索引 的 乾 糟 视图 


让 |] 保留 为 系统 记录 
-FS 所 
一 用户 记录 


图 6-1 标准 表 的 逻辑 表 、 记 录 和 索引 结构 


在 标准 表 中 ， 数 据 在 逻辑 上 是 按 数 据 页 的 列表 来 组 织 的 。 这 些 数据 页 根据 表 空 间 的 扩 
展 数 据 块 大 小 在 逻辑 上 分 组 在 一 起 ,例如 , 如 果 扩 展 数据 块 (extent) 大 小 是 4, 第 0 至 3 页 
是 第 1 个 扩展 数据 块 ， 那 么 第 4 至 7 页 就 是 第 2 个 扩展 数据 块 ， 依 此 类 推 。 

根据 数据 页 大 小 以 及 记录 大 小 的 不 同 ， 每 个 数据 页 中 所 包含 的 记录 数 可 能 会 有 所 变 
化 。 大 多 数 页 仅 包 含 用 户 记 录 。 人 但是， 少数 页 包括 特殊 的 内 部 记录 ，DB2 使 用 这 些 记 录 来 
管理 表 。 例如 , 在 标准 表 中 , 每 个 第 500 个 数据 页 怠 有 一 个 “ 衬 朵 空间 控制 记录 ”(FSCR)。 
这 些 记录 映射 下 面 500 个 数据 页 (直到 下 一 FSCR 为 止 ) 上 可 供 新 记录 使 用 的 可 用 空间 。 当 
器 表 插 入 记录 时 ， 将 使 用 这 部 分 可 用 空间 。 

在 好 辑 上 , 索引 页 组 织 成 B+ 树 ， 这 可 以 有 效 地 在 表 中 定位 带 有 给 定 键 值 的 记录 。 索 引 
页 上 的 项 数 不 是 固定 的 ， 依 赖 于 键 的 大 小 。 对 于 DMS 表 空 间 中 的 表 ， 索 引 页 中 的 记录 标 
识 (RID) 使 用 相对 表 空 间 页 号 ， 而 不 是 对 象 相 对 页 号 。 这 使 索引 扫描 能 够 直接 访问 数据 页 ， 
而 不 需要 “扩展 数据 块 映 像 页 ”(EMP) 来 进行 映射 。 
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每 个 数据 页 都 具有 相同 的 格式 。 每 个 数据 页 的 开头 都 有 页 头 。 在 页 头 后 面 ， 有 覃 目录 。 
槽 目录 中 的 每 一 条 目 都 与 该 页 中 的 一 个 记录 相对 应 。 条 目 本 喘 是 数据 页 中 记录 开始 位 置 的 
字 节 位 移 。 值 为 - 1 的 条 目 与 已 删除 的 记录 相对 应 。 

2. 记录 标识 和 数据 页 

记录 标识 (RID) 由 页 号 及 随后 的 槽 号 组 成 。 在 使 用 索引 来 标识 RID 之 后 ， 便 使 用 RID 
来 到 达 正 确 的 数据 页 及 该 页 上 正确 的 槽 号 ， 如 岁 6-2 所 示 。 一 旦 对 记录 指定 了 RID， 在 进 
行 表 重 组 之 前 ， 该 RID 便 不 会 更 改 。 


数据 页 和 RID 格式 。 页 号 


支持 的 页 面 大 小 

4KB, 8KPB, 

可 用 空间 一 16KB， 32KB 
(无 需 页 面 重 组 就 可 用 ? 在 创建 表 空间 同时 进行 
3 。 设置， 必须 为 每 个 表 空 
嵌入 可 用 空间 __， es 间 都 分 配 一 个 具有 匹配 

(联机 页 面 重组 后 可 用 ") ”页 大 小 的 缓冲 池 。 

* 例 外: 被 未 落实 的 DELETE 语句 保留 的 任何 空间 都 不 可 用 


图 6-2 ”数据 页 和 记录 标识 (RID) 格 式 


重组 表 时 , 删除 记录 后 , 实际 在 页 上 留 下 的 代入 可 用 空间 被 转换 成 可 使 用 的 可 用 空间 。 
根据 记录 在 数据 页 上 的 移动 重新 定义 RID， 以 利用 可 使 用 的 可 用 空间 。 

DB2 支持 不 同 的 页 大 小 。 对 于 有 可 能 连续 访问 行 的 工作 负载 ， 请 使 用 较 大 的 页 大 小 。 
例如 ，OLAP 应 用 程序 或 大 量 使 用 临时 表 的 场合 使 用 的 便 是 顺序 访问 。 对 于 更 有 可 能 进行 
随机 访问 的 工作 负载 ， 使 用 较 小 的 页 大 小 。 例 如 ，OLIP 环境 中 使 用 的 便 是 随机 访问 。 


3. B+ 树 结构 


DB2 数据 库 管 理 器 使 用 B+ 树 结构 (Oracle 数据 库 有 位 赂 索引 ， 而 DB2 没有 ) 进 行 索 引 
存储 。B+ 树 有 一 层 或 多 层 ， 如 图 6-3 所 示 。 其 中 ，RID 表示 行 标识 。 
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图 6-3 B+ 树 结构 


顶层 称 为 根 贡 点 。 撒 层 由 叶 节 点 组 成 , 底层 存储 的 指针 (RID) 指 问 包 含 键 值 的 表 中 的 行 。 
根 节 点 层 和 叶 节 点 层 之 间 的 那些 层 称 为 中 间 节 点 层 。 

当 奉 找 特定 的 索引 键 值 时 ， 索 引 管理 器 会 从 根 节 点 开始 搜索 该 索引 树 。 对 于 下 一 层 的 
每 个 节点 ， 根 都 包含 一 个 键 。 每 个 键 的 值 是 下 一 层 中 对 应 节点 的 最 大 现 有 键 值 。 例 如 ， 
果 索 引 有 三 层 (图 6-3 中 所 示 )， 那 么 要 得 找 茶 个 索引 键 值 ， 索 引 管 理 舌 将 搜索 根 节 点 ， 
但 找 大 于 或 等 于 要 得 找 的 键 的 第 一 个 键 值 。 根 币 点 键 指 同 特定 的 中 间 和 点 。 er 
循 此 过 程 损 历 中 间 节 点 ， 直 到 找到 包含 需要 的 索引 键 的 叶 节 点 为 止 。 

图 6-3 显示 要 查找 的 键 是 “31”。 在 根 节 点 中 大 于 或 等 于 “31” 的 第 一 个 键 是 “45”， 
它 指 癌 下 一 层 的 中 间 节 点 。 在 该 ea “312” 的 第 一 个 键 是 “33”， 它 指 同 
“33” 的 索引 键 及 其 对 应 的 行 标 识 的 特定 叶 节 点 。 然 后 扫描 这 个 叶子 节 交趾 基于 名 
找到 “31” 键 值 对 应 的 RID， 交 后 省 溢 尖 科 到 上 \ 体 的 数据 页 叶 节 点 层 也 可 以 包含 指 回 前 
一 个 叶 节 点 的 指针 。 这 些 指针 人 允许 索引 管理 器 在 找到 范围 内 的 某 个 值 时 ， 按 任 一 方向 扫描 
叶 节 点 以 检索 某 个 范围 内 的 值 。 仅 当 使 用 ALLOW REVERSE SCANS 子 句 创建 了 索引 时 ， 
才 可 能 有 按 任意 方 癌 扫描 的 能 力 。 


6.3 理解 索引 访问 机 制 


DB2 优化 器 会 首先 考虑 是 否 使 用 索引 来 实现 查询 。 在 优化 器 做 出 此 决定 之 前 ， 必 须 确 
定 所 查询 的 表 上 是 否 存 在 索引 。 可 以 但 询 任 何 表 中 的 任何 列 ， 却 不 能 期 望 每 次 都 通过 索引 
来 做 到 这 一 点 。 所 以 ， 优 化 器 必须 能 够 访问 未 建立 索引 的 数据 ， 即 全 表 扫 摘 。 

事实 上， 在 大 多 数 情况 下 ，DB2 优化 器 会 使 用 索引 。 因 为 索引 可 以 大 大 提高 数据 检索 
的 速度 。 然 而 ， 如 条 不 存在 和 索引， 就 无 法 使 用 它 了 。 并 且 在 茶 些 情况 下 仅仅 使 用 数据 的 全 
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扫 插 束 可 以 极 好 地 实现 条 些 类 型 的 SQL 语句 。 例 如 ， 考 虑 下面 这 条 SQL 语句 : 
SELECT * FROM EMP; 


在 这 条 语句 中 , 为 什么 DB2 非 要 试图 使 用 索引 呢 ? 这 里 没有 WHERE 子 句 , 所 以 全 
扫描 是 最 佳 的 。 即 使 指定 了 WHERE 子 句 ， 如 果 优化 器 判定 全 表 扫 描 要 比索 引 扫描 效率 
更 高 ， 那 么 也 不 会 使 用 索引 。 

存在 索引 的 首要 原因 是 可 以 改善 性 能 ， 那 为 什么 有 时 全 表 扫 描 会 比索 引 扫描 还 要 好 
呢 ? 这 是 因为 索引 扫描 可 能 比 简单 的 表 扫描 要 慢 。 例 如 ， 非 常 小 的 表 可 能 只 有 几 个 页 面 。 
读 取 所 有 的 页 面 可 能 比 先 读 取 索 引 页 然后 再 读 取 数 据 页 要 快 。 甚 至 对 于 较 大 的 表 ， 在 某 些 
情况 下 ,组织 索引 可 能 需要 额外 的 IO 以 实现 查询 。 当 不 使 用 索引 来 实现 查询 时 ， 产 生 的 
存 取 路 径 会 采用 表 扫 描 方 法 。 

表 扫描 通常 会 读 取 表 中 的 每 个 页 面 。 但 在 某 些 情况 下 ，DB2 会 非常 聪明 ， 它 会 限定 要 
扫描 的 页 面 。 此 外 ,DB2 可 以 调用 顺序 预 取 以 在 请 求 某 些 页 面 之 前 就 读 取 这 些 页 面 . 当 SQL 
请 求 需要 按照 数据 存储 在 磁盘 上 的 顺序 来 顺序 地 访问 多 行 数据 时 ， 顺 序 预 取 特别 有 用 。 当 
优化 器 确定 查询 将 按照 顺序 读 取 数据 页 面 时 ， 它 会 通知 应 该 启用 顺序 预 取 。 表 扫描 常常 得 
益 于 顺序 预 取 所 做 的 提前 读 取 工作 ， 因 为 当 某 个 查询 请 求 数据 时 ， 这 些 数据 已 经 放 在 内 存 
中 了 。 

快速 的 索引 式 访问 


一 般 来 讲 ， 访 问 DB2 数据 的 最 快 方式 是 使 用 索引 。 索 引 的 目的 就 是 能 够 快速 准确 地 
定位 到 具体 的 数据 。 几 6-3 显示 了 B+ 树 索 引 的 结构 。 可 以 看 出 ， 通 过 简单 地 从 树 根 授 历 到 
叶子 页 ， 可 以 快速 地 找到 相应 的 数据 页 ， 在 那里 有 请 求 的 数据 。 但 是 ，DB2 采用 的 索引 类 
型 多 种 多 样 。 所 以 ， 索 引 扫 摘 有 多 种 方式 。 

第 一 种 (也 是 最 简单 的 ) 索 引 扫 摘 方式 是 直接 索引 得 找 。 对 于 直接 索引 符 找 ，DB2 从 索 
引 的 根部 开始 ， 癌 下 遍历 ， 经 过 中 间 叶 子 页 直到 抵达 相应 的 叶子 页 。 在 那里 ， 它 将 读 取 实 
际 数据 页 面 的 指针 。 根 据 索引 条 目 ，DB2 将 读 取 正确 的 数据 页 面 以 返回 期 望 的 结果 。 对 于 
DB2， 为 了 执行 直接 索引 人 查找， 在 索引 中 必须 为 每 个 列 提供 值 。 例 如 ， 考 虑 EMPLOYEE 
表 ， 该 表 有 一 个 关于 DEPTNO、TYPE 和 EMPCODE 列 的 索引 。 现 在 考虑 如 下 查询 : 


SELECT FIRSTNAME, LASTNAME, 


FROM EMPLOYEE 

WHERE DEPTNO = » 
AND TYPE = “其 
AND EMPCODE = 10;，; 
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如 果 只 指定 这 些 列 中 的 一 列 或 两 列 ， 就 不 可 能 采用 直接 索引 查找 ， 因 为 DB2 没有 针 
对 每 列 的 值 ， 丰 可 能 匹配 整个 索引 关键 了 学 。 虽 然 这 样 不 能 使 用 下 接 索 引 查 找 ， 但 可 以 使 用 
过 引 扫 折 。 有 册 类 索引 扫 拉 :匹配 索引 扫 揪 和 非 下 配 过 引 扫 描 。 有 时 称 比 配 索 引 扫 搬 为 绝 
对 定位 ; 称 非 紫 配 索引 为 相对 定位 。 还 记得 前 面 讨论 的 表 扫 插 吗 ?索引 扫 搬 与 此 类 似 。 在 
索引 扫描 中 ， 鬼 顺序 谈 取 款 引 的 叶 了 于 页 。 

匹配 索引 扫 摘 从 索引 的 根 页 开始 ， 过 历 全 叶 了 于 页 ， 这 种 扫描 方式 与 二 接 索 引得 找 方 式 
完全 一 样 。 然 而 ， 因 为 无 法 使 用 完整 的 索引 关键 学 ， 所 以 DB2 必须 使 用 它 所 拥有 的 值 来 
扫 摘 叶子 页 ， 直 到 检索 出 所 有 交配 的 什 。 现 在 考虑 重 写 前 面 那个 查询 ， 这 次 没有 使 用 
EMPCODE 谓词 : 


SELECT FIRSTNAME, LASTNAME, 


FROM EMPLOYEE 
WHERE DEPENG 3 
AND TYPE = "XX 


通过 从 根部 开始 遍历 索引 , 匹配 过 引 扫 描 用 相应 的 DEPTNO 和 TYPE 值 来 查找 第 一 
个 叶子 页。 但 可 能 有 多 条 索引 条 目 具 有 这 两 个 值 的 组 合 , 而 这 些 索 引 条 目的 EMPCODE 值 
却 不 同 。 所 以 会 按 顺 序 扫描 全 右边 的 叶子 页 ， 直 到 不 再 直到 有 效 的 DEPTNO、TYPE 和 各 
种 EMPCODE 的 组 合 。 

要 请 求 执行 匹配 索引 ， 必 须 指 定 索 引 关 键 字 中 的 高 次 序列 ， 束 是 前 面 示例 中 的 
DEPTNO。 这 癌 DB2 提供 阴历 索 引 结构 的 起 始点 ， 从 根 页 开始 过 历 , 直到 相应 的 叶子 页 。 
但 如 果 没 有 指定 这 个 高 次 序列 ， 会 发 生 什么 昵 ?” 对 上 面 的 样本 查询 做 点 改动 ， 不 指定 
DEPTNO 谓词 : 


SELECT FIRSTNAME, LASTNAME 


EF ROM EMPLOYEE 
WHERE, TYPE = “XX 
AND EMPCODE = 10; 


在 这 个 实例 中 ， 会 用 到 非 匹 配 索 引 扫 摘 。 在 这 种 情况 下 ，DB2 不 能 使 用 索引 树 结构 ， 
因为 关键 学 中 的 第 一 列 不 可 用 。 非 下 配 索 引 扫 摘 从 索引 中 的 第 一 个 叶子 页 开始 表 历 ， 应 用 
可 用 的 谓词 ， 顺 序 扫 拍 后 续 的 叶子 页 。 不 使 用 根 员 和 任何 中 间 叶 子 页 。 

一 种 特殊 类 型 的 索引 扫 拉 是 “ 仪 索 引 访问 ”(index only access)。 如 果 需 要 的 全 部 数据 
都 位 于 索引 中 ， 那 么 DB2 完全 可 以 避免 谈 取 数据 页 。 例 如 : 

SELECT DEPTNO, TYPE 


FROM EMPLOYEE 
WHERE EMPCODE = 10; 
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我 们 这 个 数据 库 中 包含 DEPTNO、TYPE 和 EMPCODE 列 的 索引 。 在 前 面 的 查询 中 ， 
只 请 求 得 询 这 几 列 。 所 以 ，DB2 完全 不 需要 访问 表 ， 因 为 在 索引 中 可 以 找到 所 有 数据 。 

DB2 可 使 用 的 另 一 类 索引 式 访 问 是 多 索引 访问 。 针 对 存 取 路 径 ， 多 索引 访问 将 使 用 多 
个 索引 。 例 如 奉 询 EMPLOYEE 表 ， 其 中 只 有 两 个 索引 一 关于 EMPNO 列 的 芭 l1 和 关于 
DEPTNO 列 的 IX2。 然 后 ， 要 求 这 条 僵 询 显示 在 茶 个 特定 部 门 工 作 的 员工 : 


SELECT LASTNAME, FIRSTNME, MIDINIT 
FROM EMPLOYEE 
WHERE, EMPNO IN {000100", "000110", "000120") 


AND DEPTNO = J; 


DB2 会 使 用 用 于 EMPNO 谓词 的 到 1 还 是 使 用 用 于 DEPTNO 谓词 的 IX2? 为 什么 不 一 
起 使 用 这 两 者 呢 ?” 这 就 是 多 索引 访问 的 实质 所 在 。 根 据 谓词 是 用 AND 连接 还 是 用 OR 连 
接 ， 可 将 多 索引 访问 分 为 两 类 : IndexANDING 和 IndexORING。IndexANDING 是 先 使 用 
索引 IX1 和 IX2 取 到 索引 扫描 的 结果 ， 然 后 对 两 个 扫描 结果 取 交 集 ， 而 IndexORING 是 先 
使 用 过 引 IX1l 和 IX2 取得 索引 扫描 结果 后 ， 然 后 执行 合并 操作 。 


6.4 


未 引 人 设计 


创建 守 引 时 需要 考 上 处 以 下 一 些 注意 事项 : 


6.4.1 


不 创建 元 余 的 索引 。 例 如 : INX1=(a，b) 和 INX2=(a，b，c)，INX1 就 是 见 余 索 引 。 
INX1 是 不 必要 的 ， 因 为 INX2 的 节点 中 包含 了 INXI1 的 所 有 键 值 和 RID。 

经 党 观察 汉 引 的 使 用 率 。 确 你 创建 的 索引 保持 较 e 高 的 使 用 率 ，6.7.3 节 会 讲 到 如 何 
便 找 数据 库 中 使 用 率 低 下 的 索引 。 

考虑 索引 的 维护 成 本 。 当 向 表 中 增加 和 删除 数据 时 ， 这 个 表 上 所 有 的 索引 也 会 同 
时 被 维护 ， 或 者 修改 的 字段 被 索引 时 ， 也 会 同时 更 新 索引 上 的 信息 。 所 以 如 果 表 
数据 经 痢 被 更 新 ， 请 考虑 额外 的 索引 会 对 性 能 产生 什么 样 的 影响 。 由 于 索引 是 键 
值 的 永久 列表 ， 它 们 在 数据 库 中 宕 要 占用 空间 ， 因 此 创建 许多 索引 就 需要 数据 库 
中 有 更 多 的 存储 空间 。 所 需 的 空间 总 量 由 键 列 的 长 度 决定 。 

需要 考虑 索引 列 的 顺序 。 按 适当 的 列 的 顺序 定义 索引 ， 该 索引 将 大 大 提高 查询 的 
性 能 。 


创建 索引 


使 用 命令 行 处 理 帮 来 创建 索引 ， 可 输入 以 下 形式 的 语句 : 


237 


238 


DB2 数据 库 性 能 调整 和 优化 (第 3 版 ) 


CREATE INDEX <name> ON <table name> (<CcolLumn name>) 


可 以 创建 索引 ， 它 将 允许 重复 值 ， 即 非 唯一 索引 。 这 人 允许 在 构成 索引 的 一 列 或 多 列 中 
存在 重复 值 。 下 列 SQL 语句 根据 EMPLOYEE 表 中 的 LASTNAME 字段 创建 名 为 LNAME 
并 且 按 照 升 序 排序 的 非 唯一 索引 ， 


CREATE INDEX LNAME ON EMPLOYEE (LASTNRME ASC) 
以 下 SQL 语句 基于 电话 号 公 列 创建 倒序 的 唯一 索引 : 
CREATE UNIQUE INDEX PH ON EMPLOYEE (PHONENO DESC) 


唯一 索引 确保 在 构成 索引 的 一 列 或 多 列 中 不 存在 睾 复 的 值 。 如 果 构 成 索引 的 一 个 或 多 
个 列 组 成 的 集合 已 经 有 重复 的 什 ， 唯 一 索引 将 创建 失败 。 

关键 子 ASC 按照 列 的 升序 放置 这 些 索引 项 , 而 DESC 则 按照 列 的 降序 放置 它们 。 寺 认 
为 升序 。 


6.4.2 创建 集群 索引 
以 下 SQL 语句 在 EMPLOYEE 表 的 LASTNAME 列 上 创建 集群 索引 ， 称 为 INDEX1: 
CREATE INDEX INDEX|1 ON EMPLOYEE (LASTNAME) CLUSTER 


为 了 让 语句 更 有 效 ， 可 以 通过 PCTFREE 参数 来 创建 集群 索引 ， 以 便 可 以 将 新 数据 插 
入 到 正确 的 页 上 ， 从 而 维护 该 集群 的 次 序 。 通 常情 况 下 ， 表 上 的 INSERT 操作 越 多 ， 为 维 
护 集群 所 需要 的 PCTFREE 值 就 越 大 。 因 为 这 个 索引 确定 数据 在 物理 页 上 放置 的 次 序 ， 所 
以 对 任何 特定 的 表 痢 只 能 定义 一 个 集群 和 索引。 集群 索引 创建 后 需要 对 表 进 行 REORG 才能 
使 表 中 的 数据 顺序 与 索引 一 致 。 

另 一 方面 ， 如 果 这 些 新 行 的 索引 关键 字 值 总 是 新 的 大 关键 字 值 ， 那 么 表 的 集群 特性 将 
尝试 把 它们 放 到 表 的 末尾 。 在 这 种 情况 下 ， 将 表 设 置 为 退 加 方式 可 能 优 于 使 用 集群 索引 。 
可 以 执行 如 下 命令 来 将 表 设 置 为 奶 加 方式 : ALTER TABLE tabname APPEND ON.。 

注意 : 

当 表 上 有 集群 索引 时 不 能 开启 APPEND ON， 因 为 这 两 个 的 作用 相 矛 盾 ， 请 读者 想 想 
为 什么 。 


PCTFREE 也 适用 于 缓解 表 中 记录 UPDATE 后 引起 的 “溢出 行 ” 


第 6 章 索引 设计 与 优化 


6.4.3 ”创建 双 同 索引 


CREATE INDEX 语句 中 的 ALLOW REVERSE SCANS 子 句 创建 的 索引 可 以 正 向 或 反 
回 扫 摘 。 例 如 下 面 的 SQL 语句 : 

CREATE INDEX iname ON tname (cname ASC) ALLOW REVERSE SCANS 

在 这 种 情况 下 ， 基 于 给 定 列 (cname) 中 的 递增 值 (ASC) 形 成 索引 (iname)。 尽 管 列 上 的 款 
引 定 义 用 来 按照 递增 次 序 扫 描 ， 但 由 于 指定 了 ALLOW REVERSE SCANS 子 句 ， 因 而 可 以 
按照 降序 ( 反 回 ) 扫 摘 。 


索引 页 的 合并 与 分 裂 

CREATE INDEX 语句 的 MINPCTUSED 子 名 指定 在 索引 叶 页 上 最 小 已 用 空间 的 浆 值 。 
当 创 建 案 引 时 指定 这 个 子 句 ， 那 么 每 当 从 这 个 索引 的 叶子 页 中 删除 关键 子 后 ， 并 且 叶 子 页 
上 已 用 空间 的 百分比 小 于 指定 的 效 值 时 ， 融 检 伍 相 邻 的 宗 引 叶子 页 来 确定 是 售 可 以 将 两 个 
叶子 页 上 的 关键 字 合 并 到 单个 索引 页 中 。 例 如 ， 下 列 SQL 语句 将 局 用 联机 索引 合并 : 


CREATE INDEX LASTN ON EMPLOYEE (LASTNAME) MINPCTUSED 20 


我 们 知道 , 每 当 从 EMPLOYEE 表 中 删除 一 条 记录 时 , LASTN 索引 将 会 删除 相应 的 键 ， 
那么 MINPCTUSED 20 的 意思 束 是 说 ， 删 除 索 引 里 的 键 时 ， 如 果 这 个 索引 页 上 的 已 用 空间 
占用 整个 索引 页 20% 或 更 小 ， 束 会 尝试 将 这 个 索引 页 的 键 与 相 邻 索引 页 合并 ,然后 删除 
这 个 索引 页 。 

图 6-4 是 设置 了 MINPCTUSED 后 索引 在 线 合并 的 示意 图 。 

CREATE INDEX 语句 的 PCTFREE 了 人 句 指 定 创建 么 引 时 , 每 个 索引 页 中 要 留 作 空闲 宇 
间 的 百分比 。 在 索引 页 上 保留 更 多 的 空 用 空间 将 导致 更 少 的 页 分 割 ， 这 将 减少 为 重新 获得 
顺序 索引 页 面 而 重组 表 的 需要 ， 从 而 增加 预存 取 ， 而 预存 取 是 可 以 提高 性 能 的 重要 部 件 。 
此 外 ,如 果 总 是 存在 大 关键 字 值 , 那么 就 要 考虑 降低 CREATE INDEX 语句 的 PCTFREE 子 
句 的 值 。 

对 于 只 读 表 上 的 索引 ， 使 PCTFREE 为 0; 对 于 其 他 索引 ， 使 PCTFREE 为 10， 提 供 
可 用 的 空间 ， 从 而 加 快 插入 操作 的 速度 。 此 外 ， 对 于 有 集群 索引 的 表 ， 这 个 值 应 该 更 大 一 
些 ， 确 保 集群 案 引 不 会 被 分 成 太 多 的 雄 片 。 如 果 存 在 大 量 的 插入 操作 ， 那 么 使 用 15 到 35 
之 间 的 值 或 许 会 更 合适 一 些 。 
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图 6-4 索引 的 在 线 重组 
6.4.4 ”完全 索引 访问 


CREATE INDEX 语句 的 INCLUDE 子 句 指定 在 创建 案 引 时 , 可 以 选择 包含 附加 的 列 数 
据 ， 这 些 附 加 的 列 数据 将 与 键 存储 在 一 起 ， 但 实际 上 它们 不 是 键 自身 的 一 部 分 ， 所 以 不 被 
排序 。 在 索引 中 包含 附加 列 的 主要 原因 是 为 了 提高 某 些 查询 的 性 能 。DB2 将 不 需要 访问 数 
据 页 ， 因 为 索引 页 早已 经 提供 了 数据 值 。 只 有 定义 唯一 索引 时 才 可 以 指定 INCLUDE 参数 。 
假设 我 们 经 常 需要 获得 按 EMPNO 排序 的 员工 列表 。 查 询 将 如 下 所 示 : 


SELECT EMPNO,EMPNAME FROM EMP ORDER BY EMPNO 

下 面 的 语句 创建 包含 INCLUDE 参数 的 唯一 索引 

CREATE UNIQUE INDEX IEMPNO ON EMPNO (EMPNO) INCLUDE (EMPNAME) 

这 样 ， 人 查询 所 需 的 所 有 数据 部 存在 于 索引 中 ， 不 需要 检索 数据 页 。 那 么 ， 为 什么 不 干 
脆 在 索引 中 包括 所 有 列 的 数据 呢 ? 首先 ， 这 需要 数据 库 中 的 更 多 物理 空间 ， 因 为 本 质 上 只 


是 在 索引 中 存放 包 合 的 数据 。 其 次 ， 上 只 要 更 新 了 数据 的 值 ， 数 据 的 所 有 副本 都 再 要 更 新 ， 
在 经 第 需要 时 新 和 插入 的 数据 库 中 ， 这 是 一 项 很 大 的 开销 。 最 后 ， 索 引 会 询 之 所 以 比 表 会 


第 6 章 索引 设计 与 优化 


询 更 快 ， 是 因为 一 般 来 说 ， 索 引 只 包含 表 中 的 少数 字段 ， 因 此 索引 页 中 包含 更 多 的 条 数 ， 
遍历 起 来 也 占用 更 少 的 内 存 ， 随 着 索 引 字 段 的 增加 ， 这 条 特性 也 会 慢 慢 消失 。 


6.4.5 与 创建 索引 相关 的 问题 


下 面 是 创建 索引 时 应 该 考虑 的 问题 : 

e 如 果 查 询 在 可 以 接受 的 时 间 内 完成 ， 应 避免 添加 索引 ， 因 为 索引 会 降低 更 新 操作 
的 速度 并 消耗 额外 的 空间 。 

e 重复 率 很 高 的 列 不 适合 建立 索引 。 

e 考虑 到 管理 上 的 开销 ， 尽 量 使 索引 包含 的 列 低 于 $ 个 。 

e 对 于 多 列 索 引 ， 将 但 询 中 引用 最 多 的 列 放 在 定义 的 前 面 ， 范 围 查询 的 和 学 段 放 在 过 
引 定 义 的 最 后 。 

e 提 融 索引 的 复 用 紊 。 尺 量 用 单个 索引 满足 多 条 查询。 避免 瀛 加 与 已 有 索引 相似 的 
索引 ， 因 为 这 样 会 给 优化 器 带 来 更 多 的 工作 ， 并 且 会 降低 更 新 操作 的 速度 。 相 反 ， 
我 们 应 该 修改 已 有 的 索引 ， 使 其 包含 附加 的 列 。 例 如 ， 假 设 在 表 的 (c1，c2) 上 有 索 
引 INDEX1。 可 以 注意 一 下 查询 中 使 用 了 "where c2=?", 于 是 又 创建 了 (c2) 上 的 索引 
INDEX2。 但 是 这 个 尝 引 没有 添加 任何 东西 ， 它 只 是 INDEX1 的 见 余 ， 现在 反而 成 
了 额外 的 开销 。 

e 对 于 联机 事务 处 理 (OLITP) 环 境 ， 创 建 一 个 或 两 个 楷 引 ;对 于 只 斌 和 伍 询 环境 ， 可 以 
创建 5 个 以 上 索引 ， 对 于 混合 查询 和 OLTP 环境 ， 可 以 创建 2 到 5 个 索引 。 

e 要 提 噩 对 父 表 执行 删 除 和 更 新 操作 的 性 能 ， 在 外 键 上 创建 关系 索引 。 


6.4.6 创建 索引 示例 


在 最 频繁 的 查询 和 事务 的 WHERE 子 句 中 使 用 的 那些 列 上 创建 关系 索引 。 

以 下 WHERE 子 句 : 

WHERE WORKDEPET= AU ”OOR WOREDEPT=" E21" 

通常 将 会 从 WORKDEPT 列 上 的 索引 获 益 ， 除 非 WORKDEPT 列 包 含 许多 重复 值 。 

根据 WHERE 子 句 过 小 字段 的 顺序 来 创建 关系 索引 。 索 引 不 仅 可 以 提 璐 普通 查询 的 速 
度 , 也 可 以 提高 排序 查询 的 效率 (DISTINCT、ORDER BY、GROUP BY 都 是 用 排序 实现 的 )。 

以 下 示例 使 用 DISTINCT 子 句 |: 


SELECT DISTINCT WORKDEPT 
FROM EMPLOYEE 


数据 库 省 理 器 可 以 使 用 WORKDEPT 上 定义 为 升序 或 降序 的 索引 来 提高 此 奏 询 的 效 
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率 。 该 索引 也 可 用 于 GROUP BY 子 句 中 ， 将 值 分 组 ， 如 下 所 示 : 

SELECT WORKDEPT, AVERAGE (SALARY) 

FROM EMPLOYEE 

GROUP BY WORKDEPT 

也 可 以 把 所 要 查询 的 所 有 列 一 起 定义 到 索引 中 ， 这 样 的 查询 属于 完全 索引 查询， 不 需 
要 访问 数据 表 ， 效 率 很 高 。 

例如 ， 考 虑 下 列 SQL 语句 : 


SELECT LASTNAME, FROM EMPLOYEE WHERE WORKDEPT IN ("A00, ‘D1l", "D21") 


如 果 为 EMPLOYEE 表 的 WORKDEPT 和 LASTNAME 列 定义 了 关系 索引 ， 那 么 通过 
扫 拉 索引 而 不 扫 拉 整个 表 可 能 会 更 有 效 地 处 理 该 语句 。 注 意 ， 因 为 该 谓词 基于 
WORKDEPT， 因 此 此 列 应 是 该 关系 索引 的 第 一 列 。 

使 用 INCLUDE 列 创建 关系 索引 可 改善 表 上 索引 的 使 用 。 使 用 上 述 示例 ,可 将 唯一 关 
系 索引 定义 为 : 

CREATE UNIQUE INDEX X ON employee (workdept) INCLUDE (lastname) 


指定 lastname 为 INCLUDE 列 而 不 是 索引 键 的 一 部 分 , 意味 看 lastname 只 存储 在 索引 
的 叶 于 页 上 。 


注意 : 
INCLUDE 只 能 用 在 创建 唯一 索引 中 。 想 优化 这 条 语句 我 们 还 有 另 一 个 取 巧 的 办 法 ， 
利用 索引 的 宛 余 ， 也 就 是 CREATE INDEX x ON employee(workdeptlastname) 


6.5 ”索引 创建 原则 与 示例 


6.5.1 索引 与 谓词 


DB2 中 存在 4 种 类 型 的 查询 谓词 : Range-delimiting、Index-sareable、Data-sargable 和 
Residual。 其 中 ，sargable 是 search areument 的 缩写 ， 表 示 在 人 确定 人 查询 条 件 时 使 用 某 个 参数 
进行 搜索 。 这 4 种 谓词 放 在 where 和子 句 中 作为 查询 条 件 时 ， 人 性 能 依次 下 降 。 按 最 佳 性 能 到 
最 差 性 能 的 顺 太 排 列 如 下 所 未: 

e 江 转 定 罩 (了 ange-delimiting)i 朋 词 

e 索引 控制 (ndex-sargable) 谓 词 

e 数据 控制 (Data-sargable) 谓 词 
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e 保留 谓词 (Residual]) 
表 6-1 概述 了 各 谓词 类型 的 特征 ， 后 面 会 更 详细 地 拍 述 每 个 类 别 。 


表 6-1 谓词 类 型 的 特征 摘要 
谓词 类 型 


mn | em | sm | 
ET 


特 征 


9j 
Dj 


双 


减少 内 部 传 运 的 行 数 


Range-delimiting 谓词 是 指 那些 在 进行 索引 扫描 时 可 以 明确 限定 边界 的 谓词 , 它们 为 索 
引 搜 索 提 供 了 start 和 /或 stop 键 值 。Index-sargable 谓词 不 能 限定 索引 扫描 的 范围 ， 但 由 于 
谓词 中 的 列 是 索引 的 一 部 分 ， 因 此 谓词 也 可 以 从 索引 中 过 有 历 出 来 。 

比如 ， 索 引 IDX1 定义 如 下 : 


| 
人 
| 


# 


INDEX IDX1: NAME ASC, DEPT ASC, MGR DESC, SALARY DESC, YEARS ASC 
并 且 有 下 面 的 查询 子 句 : 


WHERE NAME = :hvl 
AND DEPT = :hv2 
AND YEARS > :hv5 
其 中 “NAME = :hv1” 和 “DEPT= :hv2” 属 于 Range-delimiting 谓词 , 而 “YEARS > :hv5” 
属于 Index-sargable 谓词 。 数 据 库 管 理 堆 利用 索引 数据 评估 谓词 而 不 再 要 谈 取 基 表 。 
Index-sargable 谓词 通过 减少 需要 从 表 中 谈 取 的 行 数 而 减少 了 数据 页 的 数量 。 这 类 谓词 不 能 
减少 索引 页 的 读 取 数量 。 
那些 不 能 被 索引 管理 堪 搜 索 的 谓词 ， 但 是 可 以 被 数据 管理 服务 搜索 的 谓词 被 称 为 
Data-sargable 谓词 。 这 些 谓 词 需 要 访问 基 表 的 行 ， 如 条 需 要， 数据 管理 服务 将 获取 需要 的 
列 来 搜索 谓词 ， 如 < 谓词 、Like '"%H' 谓 词 。 
再 如 ， 给 定 下 面 定 义 在 PROJECT 表 上 的 索引 : 


INDEX IDXV0: PROJNO ASC 


同时 给 定 下 面 的 得 询 : 
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SELECT PROJNO, PROJNAME, RESPEMP 

FROM PROJECT 

WHERE DEPTNO = "Dl11'" 

ORDER BY PROJNO 

谓词 “DEPTNO = 'D11'” 就 是 Data-sargable 谓词 ， 因 为 它 没 有 被 索引 。 

Residual 谓词 一 般 是 指 需要 的 IO 已 经 超越 了 简单 基 表 访问 , Residual 谓词 可 以 是 使 用 
关联 的 子 查 询 ， 也 可 以 是 使 用 ANY、ALL、SOME、IN 的 子 查询 ， 或 是 读 取 LONG、 
VARCHAR、LOB 数据 的 谓词 。 


6.5.2 根据 查询 使 用 的 列 建立 索引 


建立 索引 是 用 来 提高 和合 询 性 能 的 最 帅 用 方法 。 对 于 未 个 特定 的 合 询 ， 可 以 为 未 个 表 中 
出 现在 碍 询 中 的 所 有 列 建立 联合 索引 ， 包 括 出 现在 SELECT 语句 和 条 件 子 句 中 的 列 。 但 入 


重要 的 。 这 个 特性 是 由 索引 的 B+ 树 结构 决定 的 。 一 般 情 况 下 ， 要 根据 谓词 的 选择 上 度 来 排列 
索引 中 各 列 的 位 置 ， 选 择 度 大 的 谓词 使 用 的 列 帮 在 索引 的 前 面 ， 把 那些 只 存在 于 SELECT 
语句 中 的 列 放 在 索引 的 最 后 。 例 如 下 面 的 会 询 : 

例 6-1 索引 中 的 谓词 位 置 。 


select add date 

from temp.customer 

where city = 'WASHINGTON 
and cntry Code 三 “USA ， 


这 样 的 查询 可 以 在 temp.customer 上 建立 (city，cntry code，add date) 索 3 引 。 由 于 该 索 
引 包 含 了 但 询 所 需 的 所 有 列 ， 因 而 此 查询 将 不 会 访问 temp.customer 的 数据 页 ， 而 是 直接 使 
用 索引 页。 对 于 包含 多 列 的 联合 索引 ， 索 引 树 中 的 根 节 点 和 中 间 廊 点 存储 了 多 列 的 值 的 联 
合 。 这 恕 决定 了 存在 两 种 索引 扫描 。 回 到 例 6-1 中 的 查询 ， 由 于 此 查询 在 新 建 索 引 的 第 一 
列 上 存在 娟 词 条 件 ，DB2 能 够 根据 这 个 谓词 条 件 从 索引 树 的 根 贡 点 开始 过 历 ， 经 过 中 间 古 
点 ， 最 后 定位 到 茶 个 叶子 贡 点 ， 然 后 从 此 叶子 节点 开始 往 后 进行 在 叶子 币 点 上 的 索引 扫 搞 ， 
百 到 找到 所 有 满足 条 件 的 记录 。 这 种 款 引 扫 挡 束 是 我 们 前 面 押 讲 的 严 配 款 引 扫 朱 (Matching 
Index Scan)。 但 是 如 果 将 add_date 放 在 索引 的 第 一 个 位 置 ， 而 得 询 并 不 存在 add date 上 的 
谓词 条 件 ， 那 么 这 个 索引 扫 摘 将 会 从 第 一 个 索引 叶子 节点 开始 ， 它 无 法 从 根 季 点 开始 并 经 
过 中 则 节点 了 直接 定 位 到 某 个 叶子 节点 ， 这 种 扫 插 的 范围 扩大 到 了 整个 驼 引 ， 我 们 称 之 为 
非 匹 配 索引 扫描 (Non-Matching Index Scan)。 图 6-5 显示 了 DB2 根据 不 同 索 引 生 成 的 存 取 
计划 。 
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RETURN (1)86,772.23 RETURN (1)28.94 RETURN (1)33,484.29 


款 引 索引 


cust il(city,cnty cust i2(add date, 
code,add date) city,cnty_code) 


图 6-5 根据 不 同 守 引 生成 的 存 取 计划 
6.5.3 ”根据 条 件 语句 中 谓词 的 选择 度 创建 索引 


因为 建立 索引 需要 所 用 数据 库 的 存储 空间 ， 所 以 震 要 在 空间 和 时 间 性 能 之 间 进 行 权 
伪 。 很 多 时 候 ， 只 考虑 在 那些 条 件 子 名 中 有 条 件 判 断 的 列 上 建立 索引 会 同样 有 效 ， 同 时 市 
约 了 空间 。 例 如 例 6-1 中 的 查询 ， 可 以 只 建立 (city，cntry code) 索引 。 我 们 还 可 以 进一步 地 
位 得 条 件 语 句 中 这 两 个 谓词 的 选择 上 度 ， 执 行 下 面 的 语句 检查 谓词 选择 上 度 : 
例 6-2 检查 谓词 选择 度 。 
查询 : 
1. select count (*) from temp.customer where city = 'WASHINGTON'" 
and entry Code — USN 
select count (*) from temp.customer where city = "WASHINGTON'"'; 
select count(*) from Temp.customer where cntry Code = "US3A > 
果 : 
1404 


1407 
- 1 28700 


选择 度 越 大 ， 过 小 挥 的 记录 越 多 ， 返回 的 结果 集 也 就 越 小 。 从 例 6-2 的 结果 可 以 看 到 ， 
第 二 个 查询 的 选择 度 几 乎 和 整个 条 件 语句 相同 。 因 此 可 以 直接 建立 单列 索引 |(city)， 其 性 能 
与 索引 (city，cntry code，add date) 相 差不多 。 表 6-2 中 对 这 两 个 索引 的 性 能 和 大 小 进行 了 
对 比 。 
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表 6-2 ”两 个 索引 的 性 能 和 大 小 对 比 


宗 3 引 查询 计划 总 代价 索引 大 小 


cust il(city, cntry code, add date) 28.94 timerons 19.52MB 
cust 13(city) 63.29 timerons 5.48MB 


从 表 6-2 中 可 以 看 出 : 单列 索引 (city) 上 共有 更 佳 的 性 能 空间 比 。 也 就 是 说 ， 占 有 尽 可 能 
小 的 空间 而 得 到 尽 可 能 局 的 但 询 速度 。 


6.5.4 六 免 在 建 有 索引 的 列 上 使 用 函数 


这 是 一 个 很 简单 的 忌 则 。 如 果 在 建 有 索引 的 列 上 使 用 函数 ,由 于 函数 的 单调 性 不 确定 ， 
图 数 的 返回 全 和 输入 值 可 能 不 会 一 一 对 应 ， 了 吏 可 能 存在 索引 中 位 置 差 异 很 大 的 多 个 列 全 可 
以 满足 市 有 函数 的 谓词 条 件 ， 因 此 DB2 优化 器 将 无 法 进行 Matching Index Scan， 更 坏 的 
情况 下 可 能 会 导致 直接 进行 表 扫 摘 。 图 6-6 中 对 比 了 使 用 函数 前 后 的 存 取 计划 的 变化 。 


Select add date from temp .customer Select add date from temp.customer 
where city= “WASHINGTON’” and where 
cnry code= ‘USN’ ; upper(city)= “WASHINGTON” and 


cnry code= “USN” ; 


RETURN (1)63. 29 


RETURN (1)86, 818. 11 


”TBSCAN (4)63.29 | 


TEMP.CUSTOMER| ( IXSCAN (6)20.06 TBSCAN (3) 86, 818. 11 


TT ~ 
索引 : cust_i3(city) 索引 : cust_i3(city) 


图 6-6 ”使 用 图 数 前 后 的 存 取 计 划 的 变化 
6.5.5 ”在 那些 需要 被 排序 的 列 上 创建 索引 


这 里 的 排序 不 仅仅 指 ORDER BY 子 句 ， 还 包括 DISTINCT、UNION 或 GROUP BY 子 
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句 ， 它 们 都 会 产生 排序 操作 。 由 于 索引 本 身 是 有 序 的 ， 在 创建 过 程 中 已 经 进行 了 排序 处 理 ， 
因为 根据 需要 排序 的 列 来 创建 案 引 可 以 避免 得 询 时 册 次 对 数据 进行 排序 。 这 种 情况 一 般 针 
对 没有 条 件 语 句 的 租 询 。 如 条 存在 条 件 语 可 ，DB2 优化 右 会 首先 选择 出 满足 条 件 的 记录 ， 
然后 才 对 中 间 结 采集 进行 排序 。 对 于 没有 条 件 语 句 的 得 询 ， 排 序 操 作 在 总 的 得 询 代价 中 会 
占有 较 六 比重 ， 因 此 能 够 较 大 限度 地 利用 索引 的 排序 结构 进行 租 询 优化 。 此 时 可 以 创建 单 
列 索 引 ， 如 果 需 要 创建 联合 索引 ， 奢 么 需要 把 被 排序 的 列 放 在 联合 索引 的 第 一 列 。 图 6-7 
对 比 了 如 下 奏 询 在 创建 索引 前 后 的 存 取 计 划 。 


select distinct add date from temp.customer; 


RETURN (1)95,578.27 RETURN (1D)37,488.37 


TBSCAN (3)93,378.27 


UNIQUE (G3)37,488.37 


SORT(5)95,578.21 


IASCAN (3S)34,988.39 


TBSCAN (7)70,826.52 


索引 


cust i4(add date) 
图 6-7 在 创建 尝 引 前 后 的 存 取 计 划 


从 图 6-7 中 我 们 可 以 看 出 ,在 没有 索引 的 情况 下 SORT 操作 是 24751.69 timerons; 但 
在 有 索引 的 情况 下 ， 不 由 需要 对 结果 集 进行 排序 ， 而 是 可 以 了 直接 进行 UNIQUE 操作 ， 图 
中 显示 这 一 操作 只 花费 了 2499.98 timerons。 

图 6-8 对 比 了 以 下 碍 询 在 创建 联合 索引 表 后 的 存 取 计 划 ， 从 中 可 以 更 好 地 理解 索引 对 
排序 操作 的 优化 : 


无 索引 


select cust name from temp.customer order by add date; 


索引 的 B+ 树 结构 决定 了 索引 temp.cust 15 的 所 有 叶子 节点 本 和 吴 就 是 按照 add date 
排序 的 ， 所 以 对 于 该 查询 而 言 ， 只 需要 顺序 扫描 索引 temp.cust_i5 的 所 有 叶子 节点 。 但 是 
对 于 temp.cust 16 索引 ， 所 有 叶子 节点 是 按照 cust name 排序 的 ， 因 此 在 经 过 对 索引 的 叶 
子 节点 扫描 并 获得 所 有 数据 之 后 ， 还 需要 对 add_date 进行 排序 操作 。 
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RETURN (1) 332, 794. 31 
SORT (5) 267, 853. 66 
TBSCA (7) 70, 826. 52 


TEMP.CUSTOMER 
TEMP.CUSTOMER i 


无 索引 索引 cust_i4(add_date) 


TEMP.CUSTOMER 


索引 cust_iS(cust name,add date) 
图 6-8 创建 联合 索引 前 后 的 存 取 计划 


6.5.6 合理 使 用 INCLUDE 关键 词 创建 索引 
对 于 关 似 下 面 的 得 询 : 


select cust name from temp.customer 
where cust num between ‘00071000000" and “0007200000 


我 们 可 以 在 cust num 和 cust name 上 建立 联合 索引 来 提高 但 询 性 能 。 但 是 由 于 
cust num 是 主键 ， 是 唯一 的 ， 因 此 可 以 使 用 INCLUDE 关键 字 创 建 唯一 索引 : 


create unique index temp.cust 17 on temp.customer (cust num)include 
(cust name):; 


使 用 INCLUDE 后 ， 实 际 上 只 是 将 cust name 列 的 数据 从 表 中 复制 一 份 放 到 索引 树 的 
叶子 节点 ， 并 不 属于 索引 的 键 。 在 这 种 情况 下 ， 对 于 奏 询 来 说 ，INCLUDE 的 唯一 索引 和 
联合 索引 是 同等 的 ; 但 是 对 于 索引 的 生成 时 间 以 及 今后 维护 的 代价 来 说 ， 创 建 宙 有 
INCLUDE 列 的 唯一 索引 会 带 来 优 于 联合 索引 的 性 能 ， 因 为 INCLUDE 列 里 的 数据 不 参与 
排序 。 对 于 上 面 的 查询 示例 , 创建 索引 temp.cust i7 后 存 取 计划 的 代价 为 12338.7 timerons， 
创建 联合 索引 temp.cust i8(cust num，cust name) 后 的 代价 为 12363.17 timerons。 一 上 般 情 况 
下 ， 当 得 询 的 WHERE 子 句 中 存在 主键 的 谓词 时 ， 我 们 束 可 以 创建 市 有 INCLUDE 列 的 唯 
一 索引 ， 用 完全 索引 访问 来 提高 查询 性 能 。 
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注意 : 
INCLUDE 只 能 用 在 创建 唯一 索引 中 ， 
6.5.7 指定 索引 的 排序 属性 
下 和 面 是 用 来 显示 最 近 一 个 员工 入 职 时 间 的 查询 : 


select max (aad date) trom temp.employee: 


很 显然 ， 这 个 查询 会 进行 全 表 扫 摘 。 但 询 计划 如 图 6-9(a) 有 所 示 。 


显然 ， 我 们 可 以 在 add date 上 创建 索引 。 根 据 下 面 的 命令 创建 索引 后 的 查询 计划 如 
图 6-9(b) 所 示 。 


Create mder tom cnmnlorree Tom Eom emplovee loadd datey: 


这 里 存在 误区 ， 大 家 可 能 认为 既然 得 询 里 要 取得 的 是 add_date 的 最 大 值 ， 而 我 们 又 
在 add date 上 建立 了 索引 ， 优 化 礁 应 该 知道 从 索引 树 中 直接 寻找 最 大 值 。 但 是 实际 情况 
并 非 如 些 ， 因 为 创建 索引 的 时 候 并 没有 指定 排序 属性 ， 献 认为 ASC 升序 排列 ，DB2 将 会 
扫 拍 整个 索引 树 的 叶子 古 上 吕 ， 在 取得 所 有 值 后 ， 取 其 中 最 大 值 。 我 们 可 以 通过 设置 索引 的 
排序 属性 来 提高 得 询 性 能 ， 根 据 下 和 面 的 命令 创建 荣 引 后 的 但 询 计 划 如 图 6-9(c) 所 未 。 


create index temp employee 12 on temp-employee(add date desc)s 


”RETURN (1) 31, 993. 5 RETURN (1) 19. 55 


RETURN (1)46, 032. 74 


GRPBY (3) 19. 51 
IXSCAN (5) 27, 993. 57 


GRPBY (3) 31, 993. 46 


GRPBY (3) 46, 032. 71 


无 索引 employee il(add date asc) _ employee LW(add date desc) 
(a) (b) (9) 


图 6-9 ”查询 计划 


对 于 降序 排列 的 索引 ，DB2 不 需要 扫 摘 整个 索引 树 的 叶子 节点 ， 因 为 第 一 个 节点 便 是 
最 大 的 。 我 们 同样 可 以 使 用 ALLOW REVERSE SCANS 来 指定 索引 为 双 问 扫描 ， 具 有 和 
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DESC 近似 的 查询 性 能 。ALLOW REVERSE SCANS 可 以 被 认为 是 ASC 和 DESC 的 组 
合 ， 只 是 在 以 后 数据 更 新 的 时 候 维护 成 本 会 相对 高 一 些 。 

虽然 无 法 改变 索引 的 排序 属性 ， 但 是 我 们 具有 额外 的 信息 ， 该 公司 每 个 月 都 会 有 新 员 
工 入 职 ， 那 么 这 个 查询 就 可 以 改 与 成 : 


select max(add date) from temp.employee 


where aqd date > current timestamp = 1 month 


像 这 样 通过 限定 查询 范围 也 可 以 有 效 地 提高 查询 性 能 。 
6.6 ”影响 索引 性 能 的 相关 配置 


6.6.1 设置 影响 索引 性 能 的 配置 参数 
1. util heap sz 配置 参数 


CREATE INDEX 和 REORG INDEXES 都 文 持 其 他 用 户 或 应 用 程序 对 基 表 进行 写 访 
问 。 如 果 在 创建 或 重组 索引 时 需要 对 基 表 执行 大 量 更 新 活动 ， 请 考虑 配置 实用 程序 挫 
(util heap sz)。 在 同步 更 新 阶段 ， 实 用 程序 堆 将 提高 创建 或 重组 索引 的 速度 。 对 正在 创建 
或 重组 的 索引 执行 的 所 有 写 活 动 都 记录 在 DB2 日 志和 内 部 内 存 缓冲 区 空间 中 。 内 部 内 存 组 
冲 区 空间 是 根据 需要 从 实用 程序 堆 中 分 配 的 指定 内 存 区 域 ， 用 来 存储 对 正在 创建 或 重组 的 
索引 所 做 的 更 改 。 使 用 该 内 存 区 域 可 以 使 同步 更 新 阶段 能 够 更 快 地 工作 。 在 创建 或 重组 操 
作 完 成 后 ， 将 释放 所 分 配 的 内 存 。 如 果 能 确保 有 足够 的 实用 程序 堆 来 容纳 对 正在 创建 或 重 
组 的 索引 进行 的 全 部 或 大 部 分 更 改 ， 那 么 会 提高 同步 更 新 阶段 的 性 能 。 

2. sheapthres 配置 参数 

每 个 子 代 理 程序 将 获取 sortheap 配置 参数 指定 的 内 存量 ， 以 便 在 扫 摘 表 时 避免 排序 海 
出 。 应 监视 排序 溢出 数 并 相应 地 增 大 sheapthres。 

6.6.2 ”为 索引 指定 不 同 的 表 空 间 

可 将 索引 存储 在 与 表 数 据 不 同 的 表 空 间 中 。 这 样 , 通过 减少 索引 访问 期 间 读 / 写 磁头 的 
移动 , 可 以 更 有 效 地 使 用 磁盘 存储 器 。 也 可 以 在 更 快 的 物理 设备 上 创建 索引 表 空 间 。 而 且 ， 
可 以 将 索引 表 空 间 指 定 给 不 同 的 缓冲 池 ， 由 于 它们 不 与 表 数 据 页 竞争 ， 因 此 可 以 将 索引 页 
较 长 时 间 保 存在 绥 冲 区 内 。 

当 不 将 索引 放置 在 单独 的 表 衬 间 中 时 ， 数 据 页 和 索引 页 使 用 相同 的 扩展 数据 块 大 小 和 
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预存 取 。 如 果 对 索引 使 用 不 同 的 表 空 间 ， 那 么 可 为 表 罕 间 的 所 有 特征 选择 不 同 的 值 。 因 为 
索引 通 音 比 表 小 , 并 且 分 布 在 更 少 的 容 堆 中 , 因此 索引 通 弟 只 上 其 有 较 小 的 扩展 数据 块 大 小 ， 
如 8 页 和 16 页 。 当 合 询 优化 融 选 择 访 问 方案 时 ， 它 将 考虑 用 于 表 空 间 的 设备 的 速度。 


6.6.3 ”确保 索引 的 集群 度 


如 果 SQL 语句 需要 排序 (例如 包含 ORDER BY、GROUP BY 和 DISTINCT 子 句 )， 那 
么 即使 索引 可 以 满足 排序 ， 但 是 在 下 列 情 况 下 ， 优 化 器 可 能 不 会 选择 索引 : 
e 索引 集群 程度 较 低 。 有 关 信 息 请 查看 SYSCAT .INDEXES 的 CLUSTERRATIO 和 
CLUSTERFACTOR 列 。 
e 由 于 表 很 小 ， 因 此 扫描 该 表 并 在 内 存 中 对 结果 集 进 行 排序 时 消耗 的 成 本 更 低 。 


索引 的 集群 比率 和 集群 因子 统计 信息 

索引 的 集群 比率 统计 信息 存储 在 SYSTCAT INDEXES 目录 表 的 CLUSTERRATIO 列 
中 。 此 值 (在 0 到 100 之 间 ) 表 示 使 用 索引 的 数据 集群 的 程度 。 要 将 CLUSTERFACTOR 与 
CLUSTERRATIO 的 值 进行 比较 ， 可 以 将 CLUSTERFACTOR 乘 以 100 以 获得 百分比 。 


注意 : 

通常 ， 表 中 只 有 一 个 索引 可 以 具有 较 高 的 集群 度 。 索 引 扫 描 在 具有 较 高 集群 比率 的 情 
况 下 可 能 执行 得 更 好 。 低 的 集群 率 导 致 此 类 扫描 要 执行 更 多 的 HO， 因为 松散 的 集群 率 需 
要 访问 更 多 的 数据 页 。 增 大 缓冲 区 大 小 也 可 以 提高 非 集群 索引 的 性 能 。 如 果 表 数据 最 初 是 
针对 某 个 索引 集群 的 ， 而 集群 统计 信息 指示 现在 的 集群 率 很 低 ， 那 么 可 能 想 重 组 该 表 以 再 
次 集群 数据 。 


6.6.4 ”使 表 和 索引 统计 信息 保持 最 新 


当 创 建新 索引 后 ， 运 行 RUNSTATS 实用 程序 来 收集 索引 统计 信息 。 这 些 统计 信息 使 
优化 器 能 够 确定 使 用 索引 是 否 能 提高 访问 性 能 。 


6.7 索引 维护 


在 创建 案 引 之 后 ， 经 过 大 量 的 插入 和 删除 操作 以 后 ， 索 引 的 性 能 会 下 降 。 考 虑 以 下 建 
议 使 索引 尽 可 能 小 并 效率 高 : 

e 局 用 联机 索引 整理 碎片 

e 使 用 MINPCTUSED 子 句 创建 索引 

e 如 有 必要 ， 删 除 并 重新 创建 现 有 的 索引 
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e 保持 索引 的 集群 度 


6.7.1 异步 索引 清除 (AIC) 


异步 索引 请 除 (AIC) 是 在 使 索引 条 目 失效 的 操作 之 后 的 延迟 索引 清除 。 根 据 索 引 的 藉 
型 ， 条 目 可 以 是 行 标 识 (RID) 或 坎 标 识 (BID)。 无 论 是 哪 种 标识 ， 这 些 条 目 都 将 由 索引 清除 
程序 (db2aic) 除 去 ， 索 引 清除 程序 在 数据 库 后 台 开 步 运行 。 


注意 : 
如 果 分 区 表 定 义 了 物化 查询 表 (MQT)， 那 么 AIC 要 在 执行 了 SET INTEGRITY 操作 之 
后 才 局 动 。 


当 AIC 正在 进行 时 ， 将 维护 正 背 的 表 访 问 。 访 问 索 引 的 查询 将 忽略 尚未 清除 的 任何 
无 效 条 目 。 

在 大 多 数 情况 下 ， 对 与 分 区 表 关 联 的 每 个 非 分 区 索引 局 动 清除 程序 。 内 部 任务 分 发 守 
护 程序 (db2taskd) 负 责 将 AIC 任务 分 发 给 适当 的 数据 库 分 区 并 指定 数据 库 代 理 程 序 。 

分 发 守护 程序 和 清理 代理 程序 都 是 内 部 系统 应 用 程序 。 可 以 用 LIST APPLICATION 
SHOW DETAIL 来 观察 它们 的 执行 情况 ， 应 用 程序 名 称 分 别 为 db2taskd 和 db2aic。 为 了 防 
止 意外 中 断 ， 不 能 强制 执行 系统 应 用 程序 。 只 要 数据 库 是 活动 的 ， 分 发 守护 程序 就 一 直 处 
于 联机 状态 。 清除 程序 在 完成 清理 之 前 保持 活动 状态 。 如果 在 进行 清理 时 取消 激活 数据 库 ， 
那么 当 重 新 激活 数据 库 时 将 继续 进行 AIC。 


1. AIC 性 能 


AIC 仅 对 性 能 产生 很 小 的 影响 。 

每 个 清除 程序 都 获取 最 小 表 空 间 锁定 (CO 和 表 锁 定 (IS)。 如 果 清 除 程序 确定 其 他 应 用 程 
序 正在 等 待 这 些 锁 定 ， 就 会 释放 这 些 锁定 。 如 果 发 生 这 种 情况 ， 那 么 清除 程序 网 会 暂 挂 处 
理 5 分钟 。 

清除 程序 与 实用 程序 具有 集成 的 优先 级 设置 。 默 认 情 况 下 ， 每 个 清除 程序 的 实用 程序 
的 影响 优先 级 为 S0。 可 以 使 用 SET UTIL IMPACT PRIORITY 命令 来 更 改 此 优先 级 。 


2. AlC 监视 


可 以 使 用 LIST UTILITIES SHOW DETAIL 命令 来 监视 AIC。 每 个 索引 清除 程序 都 作为 
单独 的 实用 程序 出 现在 监视 堪 中 。 
以 下 示例 显示 AIC 活动 : 
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TD = 1489 
Type = _ ASYNCHRONOUS INDEX CLEANUP 
Database Name = SLOGDB 
Member Number 二 
Description = Table: SLOGDB .EN SERVICELOG, Index: 
SLOGDB .ServiCelog stmp index 
start Time = 037287201Y Fl:05:34.450685 
state = Executing 
Invocation Type = Automatic 
Throttling: 
Prioriiy = 50 

Progress Monitoring: 

Total Work oe oades 

Completed Work = 1394690 pages 

start Time = 03/28/2017 11:05:34.450924 
ID = 上 488 
Type = _ ASYNCHRONOUS INDEXA CLEANUP 
Database Name = SLOGDB 
Member Number = 
Description = Table: SLOGDB .EN SERVICELOG, Index: 

SLOGDB .PR SERVICELOG 1D 
start Time = 03729/2014 11:05:34.450697 
state = Executing 
Invocation Type = Automatic 
Throttling: 
Priority = 50 


Progress Monitoring: 
Total Work 
Completed Work 


Start Tme 


在 上 述 示 例 中 ， 有 两 个 


个 清除 程序 正在 处 理 索 引 SLOGDB.servicelog stmp index， 田 
视 部 分 显示 再 要 清除 的 总 索引 页 数 和 当前 已 完成 


SLOGDB.PK SERVICELOG ID。 进 度 监 
的 索引 页 数 。 
状态 字段 指示 清 青 除 程 ， 序 的 当前 状态 I 总 


135242316 pages 


486981 pages 


0372872017 11:05:34.450953 


清除 程序 正在 对 SLOGDB.EN SERVICELOG 表 进 行 操作 。 


一 个 清除 程序 正在 处 理 索 引 


Whe 
| | 


通常 ， 


状态 为 “正在 执行 ”如果 清除 程序 正在 
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等 待 极 指定 给 可 用 的 数据 库 代 理 程 序 ， 或 者 如 末 清 除 程序 由 于 锁定 委 用 而 临时 暂 挂 ， 那 么 
清除 程序 可 能 处 于 “正在 等 待 ” 状 态 。 


6.7.2 联机 索引 整理 碎片 


用 户 定 义 的 索引 叶子 页 上 的 最 小 已 使 用 空间 量 的 浆 值 (MINPCTUSED) 将 局 用 联机 款 
引 整 理 碎 片 。 当 从 叶子 页 删除 了 有 寺 引 键 且 超过 闪 值 时 ， 可 检 栓 相 邻 的 索引 叶子 页 以 确定 是 
否 可 合并 两 个 叶子 页 。 如 果 某 一 页 上 有 足够 的 空间 用 于 合并 两 个 相 邻 的 页 ， 那 么 立即 在 后 


人 人 4 
| El == WF |] 


联机 索引 整理 雁 片 期 间 ， 不 合并 索引 非 叶 子 页 。 但 是 ， 会 删除 空 的 非 叶 子 页 以 供 相 同 
表 上 的 其 他 索引 重用 。 要 对 DMS 存储 模型 中 的 其 他 对 象 释放 这 些 非 叶 子 页 ,或 者 释放 SMS 
存储 模型 中 的 磁盘 空间 ， 那 么 请 对 表 或 索引 进行 全 面 重组 。 表 和 索引 的 全 面 重 组 可 以 使 索 
引 尽 可 能 地 小 。 

要 重组 键 标记 为 已 删除 但 实际 上 仍 在 索引 页 中 的 type-2 索引 的 磁 上 户 ， 可 用 
CLEANUPONLYALL 选项 执行 REORG INDEXES 命令 。CLEANUP ONLY ALL 选项 整理 
索引 碎片 , 与 MINPCTUSED 的 值 无 关 。 用 CLEANUP ONLY ALL 执行 REORG INDEXES， 
如 果 两 个 相 邻 叶子 页 的 合并 全 少 可 以 在 合并 页 上 留 下 PCTFREE 可 用 空间 ， 那 么 合并 这 两 
个 相 邻 叶子 页 。 在 索引 创建 时 指定 PCTFREE， 默 认 值 为 10%。 


6.7.3 ”查找 使 用 率 低 下 的 索引 


我 们 都 知道 多 余 的 无 用 索引 会 影 啊 表 更 新 的 性 能 ， 如 何 找 出 系统 中 使 用 率 低 下 的 过 引 
呢 ? 先 看 如 下 例子 : 


db2pd -qd sample -tcbstats all tbspaceld=3 tablel1d=5 
通过 这 条 命令 我 们 可 以 得 到 如 下 输出 
sdb2pd -ad sample -tcbstats all tbspaceldq=3 tablel1d=5 


Database Member 0 -- Database SAMPLE -- Active -- Up 0 days 00:29:58 -- Date 
1072472012 10:35:58 


TCB Table Information: 


Meeess ThspacelID TableID PartID MasterTbhs MasterTab TableName 
SchemaNm ObjClass DataSlze LfSize LobS1ize XMLS1zZe 

Ox0 V00000461DAAFO 3 2 n/a 3 2 TEST 
DB2INST1 Perm 1 0 0 0 
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TCB Table Stats: 


Re TableName SchemaNm Scans UDI RTSUDI 
PqReorgs NoChgUpdts Reads FSCcrUpdates TInserts Updates Delectes 
OvF1liReads OvFI1Crtes PgDictsCrt CCLOgReads StoreBytes BytesSaved 


Ox07000000461D4AF0 TEST DB2INST1 0 0 0 
0 0 0 0 0 0 0 
0 0 本 = 


TCB Index Information: 


Address InxTbhbspace ObjectID PartID TbspaceID TableID MasterTbs 
MasterTab TableName SchemaNm IID IndexOb]jSize 

OUXU /LUUUUUU461LD>2960 3 n/a 3 3 本 
TEST BB2ZINSEL 1 4 


TCB Index Stats: 


Address TableName TID PartID EmpPgDel Rootsplits 
Bndrysplts PseuEmptEg EmPgMkdUsd Scans IxOnlyScns KeyUpdates InclUpdats 
NonBRndspts PgAllocs Merges PseuDels Delclean IntNodspl 

Ox0 000000461D3960 TEST ] n/a 0 0 0 
0 U = = U 0 0 0 0 

0 0 


RBPPTRN: /home/db21nst1s 


可 以 看 到 这 条 命令 的 输出 包括 了 这 个 表 和 这 个 表 上 所 有 索引 的 信息 ， 以 及 表 和 索引 上 
的 扫 搬 、 更 狐 、 删 除 、 插 入 的 次 数 。 由 此 可 以 判断 ， 哪 些 索 引 上 扫 揪 的 次 数 较 少 ， 束 说 明 
它们 的 利用 率 低 下 ， 然 后 可 以 考虑 是 人 否 该 将 它们 删除 ， 或 者 通过 下 面 的 语句 全 看 ， 输 出 可 
以 根据 再 要 来 调整 。 


db2 “ Select T.TABSCHEMA,T. TABNAME, S.INDNAME,S .COLNAMES,T.INDEX SCANS ， 
T.INDEX ONLY SCANS from TABLE (MON GET INDEX( rr) as TT ,SYSCAT.INDEXES AS 
3 WHERE T.TABSCHEMA = S.TABSCHEMA AND TT.TABNAME = S.TABNAME AND TT.1IID= 5.11D 
AND TTABSCHEMA NOT TIN 0 STSTBM SYSoGAT -SYSITBMABM SYSTOOLRD "DYSSTAT. 
'SYSPUBLIC') AND UNIQUERULE<>'P' ORDER BY T.TABNAME DESC with ur" 
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这 条 命令 可 以 查看 具体 的 表 以 及 这 个 表 上 的 索引 信息 ， 如 果 想 碍 看 数据 库 里 所 有 表 的 
索引 信息 ， 只 用 去 抒 tbspaceid 和 tableid 即 可 : 


sdb2pBd dd sample ~tcbstats all 


6.7.4 索引 压缩 


创建 汉 引 时 ， 在 默认 情况 下 ， 索 引 压 罗 功 能 对 已 压 顷 的 表 处 于 开 忆 状态， 对 未 压 乡 的 
表 处 于 关闭 状态 。 可 以 通过 显 式 的 create index 语句 的 compress yes 子 句 ， 也 可 以 通过 alter 
index 语句 的 compress yes 子 句 来 局 用 款 引 上 讨 缩 , 开局 索引 压 纵 后 需要 执行 索引 重组 以 便 使 

索引 压缩 实际 上 是 根据 数据 库 管 理 器 所 选择 的 压缩 算法 对 索 引 页 在 磁盘 和 内 存 中 的 
格式 进行 修改 ， 以 便 减 少 存储 空间 的 消耗 。 不 同 次 型 的 索引 以 及 索引 包含 数据 的 不 同 ， 有 具 
体 的 压缩 程度 也 会 有 所 变化 。 寺 引 讨 绑 和 表 上 讨 缩 很 相似 ， 更 详细 的 内 容 请 参见 《 融 级 进 阶 
DB2( 第 2 版 )》 中 第 3 章 的 内 容 。 


6.8 DB2 Design Advisor(db2advis) 


DB2 Design Advisor 提供 了 强大 的 功能 ， 如 图 6-10 所 示 。 


i Database 
oNItor 
Ss Package Cache , SQL text flle ADVISE INSTANCE 


Q ADVISE INDEX 


Uery 

Patroller 
: ADVISE TABLE 

dboadvie Control Center ADVISE MQT 
Design Advisor 
me” ADVISE_PARTITION 
Aoivty [— > 
Monitor 


Design Advisor 提供 的 建议 能 与 数据 库 调 优 专 家 的 建议 相 媲 关 。 对 于 非 专 家 来 说 ， 访 
工具 的 好 处 是 可 以 获得 更 好 的 设计 。 对 于 专家 来 说 ，Design Advisor 可 以 市 省 他 们 宇 吐 的 
时 间 ， 因 为 Design Advisor 可 以 提供 初始 设计 ， 然 后 由 专家 进一步 改进 设计 。Design 
Advisor 还 可 以 提供 对 专家 设计 的 独立 确认 。 

要 使 用 DesignAdvisor， 首 先 需 要 在 相应 数据 库 里 执行 EXPLAIN.DDL,， 创 建 并 存储 各 
种 数据 : 


图 6-10 Design Advisor 
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cd $INSTHOME/sql1l1ib/misc 
db2 -tvf EXPLAIN .DDL 


使 用 Design Advisor 的 第 一 步 是 收集 和 描述 提供 给 Design Advisor 的 工作 负载 。 可 以 
让 Design Advisor 从 以 下 输入 获取 工作 负载 : 

e 最 近 的 SQL 语句 (来 日 动态 SQL 快照 ) 
Query Patroller 语句 (更 适用 于 数据 仓库 数据 库 ) 
静态 SQL 语句 (来 目 应 用 程序 包 ) 
解释 后 的 SQL 语句 
Event Monitor 语句 
包含 事务 的 文件 
Activity Monitor 捕获 的 SQL 语句 

我 们 可 以 为 每 个 事务 ( 即 每 条 SQL 语句 ) 赋 了 予 值 为 1、10、100 或 1000 的 频率 。 这 将 
导致 Design Advisor 对 频率 值 为 10 的 事务 的 重视 程度 是 对 频率 值 为 1 的 事务 的 重视 程 
度 的 10 倍 。 

收集 完事 务 并 设置 好 每 个 事务 的 频率 后 ， 束 可 以 运行 命令 db2advis 来 获取 关于 索引 的 
建议 。 如 来 创建 汉 引 ，SQL 执行 成 本 可 以 提 珊 32.42%。 


db2advis -qq sample -1 top.sql ~disklimit 2 -~o newindex.ddl > adv]lis .out 
cat advis.out 

execution started at timestamp 2015-12-17-11.54.08.236000 
found [3] SQL statements from the input file 

Recommending indexes... 

total disk space needed for initial set [ 0.817] MB 

Eotal disk space constrained to | 2.000] MB 

Trying variations of the solution set. 

Optimization finished. 

1] indexes in current solution 

[1118.4197] 七 Imerons (without recommendations) 

[755.8014] timerons (with current solution) 

[32 .42 当 ] improvement 

-一 15 OF RECOMMENDED LNDEXES 


= index[ll. 0:8117MB 

CREATE INDEX “ADMIN™."IDXA4111 165541710000™ ON "ADMIN"”."HISTORY" 
("TELLER ID™ ASC, "BRANCH ID™ ASC) ALLOW REVERSE SCANS ，; 

COMMIT WORK ; 

RUNSTATS ON TABLE “ADMIN™”."HISTORY"™ FOR INDEX 
“DMIN ” - 工 DX411T1 106905470000™ ; 
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COMMIT WORKR }; 


现在 我 们 将 讲解 同一 个 案例 研究 。 

下 面 是 这 个 案例 研究 中 使 用 到 的 命令 : 

db2adyis Sanple opl sql en IMCP KE hoOwW 1 0 wr TEMP TRS 

要 点 包括 : 

e。 -mIMCP: 规定 Design Advisor 应 该 考虑 新 的 索引 人 TD 和 MQTGM、 将 标准 的 表 转 换 
成 MDC 表 (C)、 重 新 为 已 有 的 表 分 区 (P)。 默 认 情 况 是 只 考 碟 索引 。 

e -k LOW: 规定 将 工作 负载 压缩 到 LOW 级 别 。 这 里 Design Advisor 将 分 析 提 供 的 
更 大 一 组 的 工作 负载 。 默 认 情 况 是 中 等 (MEDIUMD)。 

e -1700: 规定 任何 新 的 索引 、MGQIT 等 都 不 能 消耗 多 于 700 MB 的 空间 。 稚 认 情 况 是 
数据 库 总 体 规模 的 20%。 

e -c TEMP TBS: 规定 使 用 表 空 间 TEMP TBS 作为 生成 MQT 建议 的 临时 工作 空间 。 
如 果 想 要 MQT 建议 ， 并 且 正 在 运行 DPF( 多 分 区 ) 示 例 ， 那 么 这 个 选项 是 必需 的 。 
售 则 ， 这 个 参数 是 可 选 的 。 

e 男 一 个 有 用 的 选项 (没有 给 出 ) 是 -o output _file。 该 选项 保存 脚本 ， 以 便 在 文件 中 创 
建 建议 的 对 象 。 

当 该 命令 执行 时 ， 它 描述 正在 进行 的 工作 ， 下 面 显示 了 其 中 的 一 部 分 。 全 此 ，Design 

Advisor 已 经 生成 了 有 关 除 MDC 之 外 的 所 有 对 象 的 建议 。 
Cost of workload with all recommendations included [1306186] timerons 
2 indexes in current solution 


3 partitionings in current solution 


8 MOTS in current solution 


建议 集 有 27 个 索引 (新 索引 或 已 有 的 索引 )、3 个 分 区 (与 DPF 相关 的 更 改 ， 例 如 新 的 
分 区 键 或 表 衬 间 ) 以 及 8 个 MQT( 新 的 或 已 有 的 )。 
接 下 来 ，Design Advisor 分 析 MDC， 并 在 完成 时 显示 以 下 信息 : 


3 clustering dimensions in current solution 
[12305400] timerons (without any recommendations) 
[1042873] 七 Imerons (with current solution) 


[91.53$] improvement 

“3 clustering dimensions” 意 味 看 Design Advisor 建议 3 个 MDC 维 。 这 3 个 维 可 
以 同时 在 一 个 表 上 ， 也 可 以 在 不 同 的 表 上 上。 例如，3 个 维 都 在 表 A 上 ， 或 者 其 中 1 个 维 
在 表 A 上 ,万 外 两 个 维 在 表 B 上 .性 能 统计 信息 指 的 古 所 有 建议 的 性 能 , 而 不 仅仅 是 MDC 
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建议 的 性 能 。“timerons (without any Tecommendations)” 指 的 是 现 有 设计 消耗 的 时 间 ( 广 意 
timerons 不 是 秒 )， 而 “timerons (with current solution)” 指 的 是 实施 这 些 建议 后 估计 消耗 的 
时 间 。 

接 春 ，Design Advisor 以 DDL 格式 显示 建议 ， 并 且 该 DDL 已 经 被 注释 掉 。 这 些 建议 
以 如 下 顺序 出 现 : 

(1) 包括 MDC 或 分 区 建议 的 基本 表 。 

(2) MQT 建议 (首先 是 新 的 MQT， 然 后 是 要 保留 的 已 有 的 MQT， 最 后 是 未 使 用 的 
MOQT). 

(3) 新 的 集群 索引 (如 果 有 的 话 )。 

(4) 索引 建议 (新 的 ， 保 留 的 ， 然 后 是 未 使 用 的 )。 

关于 更 改 表 的 建议 如 下 : 


-一 CREATE TABLE "ORACLE™”. "LINEITEM” ("LL ORDERKEY BIGINT NOT NULL, 
i "LL PART” INTEGER NOT NULL, 

= "DL SUPPREY" INTEGER NOT NULL. 

= "DL LINENUMBER™ INTEGER NOT NULL, 

= “1 SHIPINSTRUCT™”" CHAR(22} NOT NULEL, 

(11 other columns omitted from this example) 

一 一 MDC409022109290000 GENERATED ALWAYS AS ( ((INT(L SHIPDATE))/7) ) 
= PARTITIONING KEY ("L PARTKEY™") USING HASHING 

ee TPPEDLIRADT 

-一 ORGANIZE BY I 

二 MDCA409022109290000,， 

= L SHIPINSTRUCT ) 

—— PARTITIONING KEY (LL ORDERKEY) USING HASHING 

—— TIN TPECDLDAT 


一 一 COMMIT WORK ; 

注意 : 

这 里 建议 使 用 新 的 分 区 键 (L ORDERKEY) 替 代 当 前 的 分 区 键 (L PARTKEY), 后 者 被 注 
释 掉 了 。 这 个 表 的 MDC 建议 (ORGANIZE BY 子 和 句 ) 包 括 两 个 维 : 一 个 生成 的 列 
((INT(L SHIPDATE)/7)) 和 一 个 已 有 的 列 (L SHIPINSTRUCT). 


输出 中 接 下 来 的 是 关于 MQT 的 建议 ， 如 下 所 示 : 


-一 LIST OF RECOMMENDED MOTS 


-— MOT MOT40902204140000 can be created as a refresh immediate MOT 
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— meils 0 .009MB 
CREATE SUMMARY TABLE “ADVDEMO2™.™" MOTA0902204140000™ 
AS {SELECT OQ6.C0 AS "CO™, D6.C1 AS nCln .additional aetalls omitted 
here...) 
DATA INITIALLY DEFERRED REFRESH IMMEDIATE PARTITIONING KEY (C8) 
UsSING HASHING IN TPCDLDAT ; 
COMMIT WORK; 
REFRESH TABLE "ADVDEMO2™.™ MOTA40902204140000™; 
COMMIT WORK : 
RUNSTATS ON TABLE “ADVDEMO2™.™ MOTA0902204140000"™,; 
COMMIT WORK : 
-— MOT MOT409022041530000 can be created as a refresh immediate MOT 
{... DDL to create this table follows..) 


MQT 建议 包括 : 估计 的 大 小 、 使 用 的 表 空 间 、 分 区 键 (如 果 适 用 的 话 )、 刷 新 类 型 (立即 或 
延迟 )， 以 及 这 个 表 是 否 是 基本 表 的 复制 品 ( 由 REPLICATE 关键 字 表 明 ， 在 本 案例 中 不 是 )。 
最 后 ，Design Advisor 以 下 面 显 示 的 信息 结束 : 


8604 solutions were evaluated by the advisor 
DB2 Workload Performance Advisor tool 1s finished. 


对 于 经 党 使 用 的 查询 以 及 大 型 或 复 林 的 查询 , 将 这 些 SQL 语句 作为 输入 使 用 Design 
Advisor 来 建议 索引 

最 后 有 两 点 需要 注意 的 地 方 : 确保 在 Design Advisor 执行 之 前 运行 了 runstats; Design 
Advisor 给 出 的 建议 中 会 包含 一 项 “UNUSED EXISTING INDEXES”, 然后 建议 你 删除 一 些 
索引。 其 实 这 里 Design Advisor 只 是 根据 你 提供 的 SQL 进行 分 析 ， 只 要 不 能 优化 这 个 SQL 
的 所 有 其 他 索引 ， 它 都 认为 是 无 用 的 ， 所 以 分 析 Design Advisor 的 结束 时， 也 不 要 一 味 相 
全 忆 ; 年 蔓 各 不 是 息 遇 专 条 。 


已 


6.9 本章 小 结 


系 引 设计 总 结 


创建 的 索引 应 该 取决 于 表 中 数据 的 特点 和 表 上 的 得 询 。 
以 下 是 创建 不 同 索引 时 需要 考虑 的 要 点 : 


e 要 避 急 菜 些 排 序 ， 只 要 有 可 能 ， 就 通过 使 用 CREATE UNIQUE INDEX 语句 定 
义 主 键 和 唯一 键 。 


第 6 章 索引 设计 与 优化 


e 要 改善 数据 检索 , 将 INCLUDE 列 添加 人 至 唯一 索引 。 合适 的 列 为 : 不 需要 排序 并 且 
频 替 被 存 取 。 

e 要 加 速 多 表 关 联 的 速度 ， 考 虑 用 连接 列 作为 索引 键 。 

e 要 有 效 地 搜索 ， 决 定 对 索引 键 使 用 升序 还 是 降序 ， 这 取 定 于 最 销 使 用 的 次 序 。 尽 
管 当 在 CREATE INDEX 语句 中 指定 了 ALLOW REVERSE SCANS 参数 时 可 
以 逆 问 搜索 值 ， 但 是 按 指定 索引 次 序 的 扫 摘 比 执行 逆 辣 扫描 稍微 快 一 些 。 

e 要 节省 索引 维护 成 本 和 空间 : 

一 一 尽量 保证 索引 键 之 间 不 重复 ， 例 如 已 经 有 索引 indl(ab)， 就 不 要 再 创建 索引 
Ind2(a)。 
一 一 把 不 必要 的 字段 也 加 入 键 不 仅 浪 费 空间 而 且 降 低 查 询 效 率 。 
一 一 请 参考 以 下 实践 准则 
> ”对 于 在 线 事务 处 理 (OLTP) 环 境 ， 每 个 表 创建 2 个 或 3 个 索引 。 
> “对 于 只 谍 碍 询 环境 ， 每 个 表 可 以 创建 $ 个 以 上 索引 。 
> “对 于 混合 查询 和 在 线 事 务 处 理 环境 ， 每 个 表 可 以 创建 2 到 5 个 索引 。 

e 要 改进 对 父 表 执行 的 删除 和 更 新 操作 的 性 能 ， 请 在 外 键 上 创建 索引 。 

e 对 于 快速 排序 操作 ， 在 频 绽 用 于 排序 数据 的 列 上 创建 深 引 。 

e 要 想 避 免 分 页 ， 又 想 减 少 表 重组 的 次 数 ， 请 定义 集群 索引 。 当 定义 表 时 ， 使 用 
PCTREE 关键 学 来 指定 页 上 应 该 留 下 多 少 可 用 空间 ， 才 能 允许 将 插入 行 适 当地 放 
在 页 上 。 也 可 以 指定 LOAD 命令 的 pagefreespace 子 句 。 

e 要 启用 联机 有 索引 整理 雄 片 ， 创 建 索 引 时 使 用 MINPCTUSED 选项 。MINPCTUSED 
指定 索引 叶子 页 中 最 小 使 用 空 同 量 的 阀 值 并 启用 联机 索引 整理 雄 片 。 这 可 以 在 键 
删除 期 间 以 性 能 损失 为 代价 而 减少 重组 的 需要 。 

在 下 列 情况 下 ， 考 虑 创建 索引 : 

e 在 最 频繁 处 理 的 查询 和 事务 的 WHERE 子 句 中 所 使 用 的 那些 列 上 创建 索引 。 例 如 
以 下 WHERE 子 句 : 


WHERE WORKDEPT=AU1L OR WORKDEPT=E21 


通 当 将 会 从 WOPKDEPT 上 的 索引 获 蔓 ， 除 非 WORKDEPT 列 包含 许多 重复 值 。 
e 按 查 询 需 要 的 顺序 在 对 行 排 序 的 一 列 或 多 列 上 创建 索引 。 不 仅 在 ORDER BY 子 句 
中 ， 而 且 其 他 功能 ， 如 DISTINCT 和 GROUP BY 子 句 也 都 需要 排序 。 
例如 ， 以 下 示例 使 用 DISTINCT 子 句 : 


SELECT DISTINCT WORKDEPT 
FROM EMPLOYEE, 
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数据 库 管 理 器 可 使 用 WORKDEPT 上 定义 为 升序 或 降序 的 索引 来 消除 重复 值 。 此 
时 同一 个 索引 也 可 用 于 GROUP BY 子 句 中 ， 以 将 值 分 组 ， 如 以 下 示例 所 示 : 


SELECT WORKDEPT, AVERAGE (SALARY) 
FROM EMPLOYEE 
GROUP BY WORKDEPT 


e 使 用 复合 键 创建 索引 ， 该 键 包含 每 个 列 。 当 用 此 方式 指定 索引 时 ， 会 走 完全 索引 
扫 换 ， 这 比 读 表 更 有 效 。 
例如 ， 考 虑 下 列 SQL 语句 : 
SELECT LASTNAME 
FROM EMPLOYEE 
WHERE WORKDEPT IN (A000, "DIl’', "D21°") 
如 果 为 EMPLOYEE 表 的 WORKDEPT 和 LASTNAME 列 定 义 索 引 , 那么 通过 扫描 
索引 而 不 扫 摘 整个 表 可 能 会 更 有 效 地 处 理 该 语句 。 广 意 ， 因 为 该 谓词 基于 
WORKDEPT， 因 此 此 列 应 是 该 索引 的 第 一 列 。 如 果 只 是 针对 这 条 SQL， 使 用 
INCLUDE 列 创 建 索 引 会 更 合适 。 可 将 唯一 索引 定义 为 : 


CREATE UNIQUE INDEX x ON employee (WOTKadept) INCLUDE (lastname) 


指定 lastname 为 INCLUDE 列 而 不 是 索引 键 的 一 部 分 ， 意 味 着 lastame 不 参与 排序 
并 且 只 储存 在 索引 的 叶子 页 上 。 


索引 性 能 总 结 
考虑 关于 使 用 和 管理 索引 的 下 列 建议 : 


在 创建 索引 时 指定 并 行 性 

当 在 SMP 机 器 主 管 的 大 型 表 上 创建 索引 时 ， 可 考虑 将 intra _ parallel 设置 为 YES(]) 或 
SYSTEM( - 1) 以 利于 改进 并 行 性 能 。 

可 使 用 多 个 处 理 需 来 扫描 数据 并 对 数据 排序 。 


为 索引 指定 独立 表 空 间 

可 将 索引 存储 在 与 表 数 据 不 同 的 表 空 间 中 。 这 样 ， 通 过 减少 索引 存储 期 间 读 或 写 磁 头 
的 移动 ， 可 以 更 有 效 地 使 用 磁盘 存储 器 。 也 可 以 在 更 快 的 物理 设备 上 创建 索引 表 空 间 。 而 
且 ， 可 以 将 索引 表 空 间 指 定 给 不 同 的 缓冲 池 ， 这 可 以 将 索引 页 较 长 时 间 保 存在 组 名 区 内， 
因为 它们 不 与 表 数 据 页 竞争 。 

当 不 将 索引 放 在 单独 的 表 空 间 时 ， 数 据 页 和 索引 页 使 用 相同 的 数据 块 大 小 和 预 取 量 。 
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如 果 对 索引 使 用 不 同 的 表 空 间 ， 那 么 可 为 表 空 间 的 所 有 特征 选择 不 同 的 值 。 因 为 索引 通常 
比 表 小 ， 并 且 分 布 在 更 少 的 容器 中 ， 因 此 索引 一 般 只 具有 较 小 的 数据 块 大 小 ， 如 8KB 和 
16KB。 当 SQL 优化 器 选择 存 取 方 案 时 ， 会 考虑 用 于 表 空 间 的 物理 设备 的 速度 。 


确保 索引 集群 度 

如 果 SQL 语句 需要 排序 (如 ORDER BY、GROUP BY 和 DISTINCT), 那么 即使 索引 可 
以 满足 排序 ， 但 在 下 列 情况 下 ， 优 化 器 可 能 不 选择 索引 : 

一 一 索引 集群 程度 较 低 。 可 检查 SYSCATINDEXES 的 CLUSTERRATIO 和 

CLUSTERFACTOR 列 。 

一 一 表 很 小 ， 以 致 对 表 数 据 排序 比 扫描 索引 后 再 读 表 的 成 本 更 低 。 

一 一 对 存 取 该 表 有 多 个 索引 可 供 选 择 。 

创建 集群 索引 之 后 ， 以 传统 方式 执行 REORG TABLE， 这 可 创建 组 织 完 好 的 索引 。 要 
重新 对 表 做 集群 ， 可 以 执行 排序 和 LOAD 来 代替 。 通 常 ， 只 能 在 一 个 索引 上 对 表 做 集群 。 
在 构建 集群 索引 之 后 构建 附加 (INCLUDE) 索 引 。 和 集群 索引 试图 维护 数据 的 特定 次 序 ， 以 改 
进 RUNSTATS 实用 程序 收集 的 CLUSTERRATIO 或 CLUSTERACTOP 统计 信息 。 

要 帮助 维护 集群 及 比率 ， 在 装 入 或 重组 表 之 前 ， 在 改变 表 时 设 定 适当 的 PCTFREE。 
PCTFREE 指定 每 页 上 的 可 用 空间 提供 用 于 插入 空间 ， 以 便 可 以 适当 地 对 这 些 插 入 预 留守 
间 做 集群 。 如 果 不 为 表 指 定 PCTFREE， 那 么 重组 会 使 数据 充分 使 用 每 个 数据 页 。 


注意 : 

目前 ， 更 新 操作 不 会 维护 集群 。 换 言 之 ， 如 果 更 新 一 条 记录 以 便 其 键 值 在 集群 索引 中 
更 改 ， 那 么 不 会 将 该 记录 移动 至 新 页 来 维护 集群 次 序 。 要 想 维 护 集 群 ， 使 用 
DELETE+INSERT 来 替换 UPDATE. 


保持 表 和 索引 统计 信息 为 最 新 的 
当 创 建新 索引 后 , 运行 RUNSTATS 实用 程序 来 收集 索引 统计 信息 。 这些 统计 信息 使 优 
化 器 知道 使 用 索引 是 否 可 改进 存 取 性 能 。 


启用 联机 索引 整理 碎片 

如 果 将 MINPCTUSED 子 句 设置 为 大 于 零 ， 就 对 索引 局 用 联机 索引 整理 碎片 。 当 页 上 
的 可 用 空间 为 指定 级 别 或 低 于 指定 级 别 而 索引 仍 可 用 时 ， 联 机 索引 整理 碎片 允 许 通过 合并 
叶子 页 来 压缩 索引 。 


必要 时 重组 索引 
要 从 过 引 获 取 最 佳 性 能 ， 考 虑 定期 重组 索引 ， 因 为 对 表 进 行 更 新 会 使 得 索引 页 预 取 效 
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率 降低 。 

要 重组 索引 ， 删 除 并 重新 创建 索引 ， 或 使 用 REORG 实用 程序 。 要 减少 对 重组 的 需要 ， 
当 创建 索引 时 ， 指 定 适 当 的 PCTFREE 来 在 创建 的 每 个 索引 叶子 页 上 保留 一 定 百分比 的 可 
用 空间 。 在 将 来 的 活动 中 ， 可 将 记录 插入 索引 ， 而 使 索引 页 分 割 的 可 能 性 减 小 。 而 分 割 导 
致 索引 页 既 不 是 连续 的 也 不 是 按 排序 的 ， 从 而 导致 降低 索引 页 预 取 的 效率 。 


注意 : 

在 重组 索引 时 ， 保 留 创 建 索引 时 指定 的 PCTFREE。 删 除 并 重新 创建 或 重组 索引 也 会 
创建 大 致 连续 且 顺 序 排 列 的 新 的 一 组 页 ， 并 改进 索引 页 预 取 。 尽 管 时 间 和 资源 方面 的 成 本 
更 高 ， 但 REORG TABLE 实用 程序 也 确保 数据 页 的 集群 。 集 群 为 存 取 大 量 数据 页 的 索引 扫 
描 带 来 很 大 的 好 处 。 在 对 称 多 处 理 机 (SMP) 环 境 中 ， 如 果 intra parallel 数据 库 管 理 器 配置 
参数 为 YES 或 ANY， 那 么 “传统 的 ”REORG TABLE 方式 (该 方式 使 用 阴影 表 进 行 快速 表 
重 甘 ) 可 以 使 用 多 个 处 理 器 来 重新 构建 索引 。 


分 析 关 于 索引 使 用 情况 的 EXPLAIN 信息 

定期 在 最 频繁 使 用 的 查询 上 运行 EXPLAIN， 并 验证 每 个 索引 是 否 至 少 使 用 了 一 次 。 
如 果 有 一 个 索引 未 在 任何 查询 中 使 用 ， 考 虑 删除 该 索引 。 

EXPLAIN 信息 也 允许 碍 看 在 大 型 表 上 的 表 扫 描 是 否 是 作为 舱 套 循环 连接 的 内 部 表 来 
处 理 的。 如 果 是 这 样 ， 那 么 连接 谓词 列 上 的 索引 要 么 丢失， 要 么 被 认为 应 用 于 该 连接 谓词 
的 效率 不 局 。 


对 大 小 变化 范围 大 的 表 使 用 易 变 (volatile) 表 

易 变 表 是 大 小 在 运行 时 可 以 从 空 变 为 很 大 的 一 种 表 。 对 于 这 种 表 ， 其 中 的 基数 变化 范 
围 很 大 ， 优 化 器 可 能 生成 适合 表 扫 描 而 不 是 索引 扫描 的 存 取 方案 。 

使 用 ALTER TABLE...VOLATILE 语句 声明 表征 “ 易 变 的 ”， 人 允许 优 化 大 对 易 变 表 使 用 
索引 扫 摘 。 在 下 列 情况 下 ， 无论 统计 信息 如 何 ， 优 化 器 将 使 用 索引 扫描 ， 而 不 是 使 用 表 
扫描 : 

一 一 引用 的 所 有 列 都 在 索引 中 。 

一 一 索引 可 以 在 索引 扫描 中 应 用 谓词 。 


拉 巧 : 
使 用 db2advis 工具 来 为 特定 SQL 语句 创建 一 组 最 佳 索 引 ， 


DB2 优化 器 


让 我 们 以 一 条 语句 来 开始 我 们 的 DB2 优化 堪 之 旅 ， 这 条 语句 并 不 是 以 我 们 束 悉 的 
SQL( 如 “select cl, c2 from ...”) 语 句 的 方式 给 出 的 ， 而 是 以 我 们 更 加 熟悉 的 陈述 方式 给 出 : 
“今天 我 需要 去 商店 买 冷饮 ， 给 汽车 加 油 ， 还 有 寄 包 训 ”。 假 如 我 们 有 一 个 机 器 人 (名 字 叫 
DB2 优化 项) 负责 决定 如 何 完 成 这 些 任务 ,默认 的 , 它 可 能 会 按照 我 们 输入 的 指令 的 顺序 来 
完成 任务 ， 这 样 做 任务 当然 可 以 完成 ,但 很 可 能 不 是 完成 任务 的 最 好 方式 。 设 想 以 下 情形 : 

e 如果 先 买 冷饮 ， 冷 饮 会 不 会 在 完成 其 他 任务 的 过 程 中 化 挥 ? 

e 如果 在 去 加 油 站 的 路 上 油 束 用 光 了 怎么 办 ? 

e 当 我 们 到 邮局 的 时 候 邮 局 会 不 会 下 班 卫 ? 

是 的 ， 机 右 人 DB2 优化 堪 需 要 做 的 是 给 我 们 提供 完成 这 些 任务 的 最 佳 方案 ， 然 而 全 少 
目前 它 无 法 很 好 地 完成 这 件 事 情 ， 为 什么 ? 因为 信息 不 足 ! 

我 们 需要 提供 足够 的 信息 ， 比 如 商店 、 邮 局 、 加 油 站 的 位 置 ， 商店 、 加 油 站 、 邮 局 的 
营业 时 间 ; 冷饮 可 以 保留 多 久 不 会 化 掉 ， 我 们 现在 车 里 有 和 多少 油 ?提供 的 信息 越 完 善 ， 越 
准确 , 我 们 越 有 可 能 得 到 最 佳 方案 , 否则 , NO 信息 , NO 优化 ! 那么 需要 提供 什么 信息 呢 ? 
要 想 DB2 优化 器 给 我 们 制定 最 优 方 案 ， 需 要 提供 如 下 信息 : 
准确 实时 的 统计 信息 
合理 配置 的 数据 库 配 置 参数 
正确 的 优化 级 别 
设计 、 创 建 合理 的 索引 
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e 人 磁盘 LO 的 合理 设计 (对 应 表 空 间 的 TRANSRATE 和 OVERHEAD 参数 ) 

e 出 效 优化 的 SQL 语句 

为 了 在 数据 库 中 执行 查询 或 DML 语句 (INSERT、UPDAIE、DELETE)，DB2 必须 创 
建 访问 计划 (ACCESS PLAN)。 访问 计划 定义 了 按 什么 方式 访问 表 ， 使 用 哪些 索引 ， 以 及 用 
何 种 连接 (JOIN) 方 法 来 关联 表 等 工作 。 好 的 访问 计划 对 于 SQL 语句 的 快速 执行 至 关 重 要 ，。 
访问 计划 是 由 SQL 编译 器 生成 的 ， 而 优化 器 则 是 编译 过 程 最 核心 、 最 重要 的 组 成 部 分 ， 
此 有 时 用 DB2 优化 器 指 代 整个 SQL 编译 器 。DB2 优化 器 是 一 种 基于 成 本 的 优化 器 ， 这 意 
味 看 它 根 据 表 和 索引 的 相关 统计 信息 来 估算 不 同 访问 计划 的 成 本 ， 进 而 选择 最 优 的 访问 
计划 。 

本 章 主要 讲解 如 下 内 容 : 

e DB2 编译 器 介绍 
SQL 语句 编译 过 程 
优化 器 组 件 和 工作 原理 
扫 摘 方式 
连接 方法 
优化 器 级 别 
基于 规则 的 优化 
如 何 影 响 优 化 器 来 提高 性 能 


7.1 DB2 编译 器 介绍 


SQL 编译 器 是 DB2 的 心 胜 和 灵魂 (可 以 把 它 类 比 成 宝马 730 或 波音 747 的 发 动机 引擎 )。 
它 分 析 SQL 语句 并 确定 可 以 满足 每 条 语句 的 最 有 效 的 存 取 路 径 ( 请 参阅 图 7-1 和 图 7-2)。 
SQL 编 评 项 通过 解析 SQL 语句 来 确定 必须 访问 哪些 表 和 列 ， 从 而 明确 所 要 完成 的 操作 。 
DB2 优化 器 查询 存储 在 DB2 系统 目录 中 的 系统 编目 信息 和 统计 信息 , 以 确定 完成 满足 SQL 
请 求 的 任务 的 最 佳 方法 。 

在 数据 库 中 优化 数据 访问 是 DB2 最 强大 的 能 力 之 一 (在 所 有 的 数据 库 ， 包 括 Oracle、 
DB2、Informix、Sybase 和 SQL Server 中 ，DB2 优化 器 是 最 强大 的 )。 访 问 DB2 数据 时 应 
告诉 DB2 要 检索 什么 ， 而 不 是 如 何 检 索 。 无 论 数据 实际 上 是 如 何 存储 和 操作 的 ，DB2 和 
SQL 都 可 以 访问 数据 。 

SQL 语句 的 执行 过 程 ， 可 以 想象 成 一 个 执行 4 步骤 的 过 程 : 

(1) 接收 并 验证 SQL 语句 的 语法 语义 。 

(2) 分 析 环 境 并 优化 满足 SQL 语句 的 方法 。 
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(3) 创建 计算 机 可 读 指 令 来 执行 优化 的 SQL。 

(4) 执行 指令 或 存储 它们 以 便 将 来 执行 。 

这 个 过 程 的 第 (2) 步 是 最 关键 的 ， 这 也 是 DB2 优化 器 发 挥 作用 的 过 程 。 优 化 器 怎样 决 
定 如 何以 它 的 方式 执行 大 量 SQL 语句 ? 优化 右 有 许多 类 型 的 优化 SQL 的 梨 略 ， 它 如 何 选 
择 使 用 这 些 策略 中 的 哪 一 个 ? DB2 优化 匿 是 基于 成 本 的 优化 堪 (Cost Based Optimizer)。 这 
意味 看 优化 融 将 妨 终 尝试 为 每 个 和合 询 制定 减少 总 体 成 本 的 存 取 路 人 径 ,要 实现 这 个 目标 , DB2 
优化 融会 应 用 得 询 成 本 公式 ， 对 每 条 可 能 的 存 取 路 径 的 4 个 因 系 进行 评估 和 权衡 : CPU 成 
本 、LO 成 本 、DB2 系统 目录 中 的 统计 信息 和 实际 的 SQL 语句 ， 然 后 对 多 个 访问 计划 进行 
成 本 估算 ， 最终 选 出 最 优 的 访问 计划 。 


DB2 DBMS 
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图 7-1 运行 中 的 DB2 优化 器 
Oss: Operating System Services 


sOQMO: Memory Optimizer BSU: Base Service Utilries 
Process Model instance + DB initialization, interrupits 
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图 7-2 DB2 底层 组 件 
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7.2 SQL 语句 编译 过 程 


SQL 编 详 硕 执行 儿 个 步骤 来 产生 可 以 执行 的 访问 计划 。 这 些 步 又 显示 在 图 7-3 中 并 在 
接 下 来 进行 了 描述 。 注 意 ， 东 些 步骤 仅 针 对 联合 数据 库 中 的 碍 询 。 


SQL 的 编译 器 1. 语法 分 析 
3. 查询 重 写 

4. 下 推 分 析 

| 

i 


7. 生成 可 执 


db2exfmt db2expln 
工具 工具 


图 7-3 SQL 编译 器 执行 的 步骤 
根据 图 7-3 中 描述 的 过 程 ，SQL 语句 的 编译 需要 有 如 下 流程 : 
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1. 语法 分 析 


SQL 编译 器 分 析 人 三 询 以 验证 其 语法 。 如 果 检 测 到 任何 语法 错误 ， 例 如 “给 汽车 汤 
油 ” 中 的 语法 错误 ， 那 么 查询 编译 器 停止 处 理 ， 并 将 适当 的 错误 代码 返回 至 提交 该 查询 的 
应 用 程序 。 当 解析 完成 时 ， 创 建 该 查询 的 内 部 表现 形式 并 将 它 存 储 在 查询 图 模型 中 。 查 询 
图 模型 (Query Graph Model，QGM) 是 DB2 编译 器 内 部 一 种 数据 模型 。 


2. 语义 检查 


顷 详 苍 确 你 在 语句 的 各 个 部 分 中 没有 人 不一致 。 作 为 语义 检查 的 简单 示例 ， 编 详 项 验证 
为 YEAR 标量 函数 指定 的 列 的 数据 类 型 是 日 期 时 间 数 据 类 型 。 

编 详 融 也 将 行为 语义 添加 全 该 合 询 图 模型 ， 包 括 参 考 约 束 、 表 检 伍 约束、 触发 费 和 视 
图 的 作用 。 访 得 询 图 模型 包 合 得 询 的 所 有 语义 、 码 询 块 、 子 得 询 、 相 关 、 浅 生 的 表 、 表 达 
式 、 数 据 撩 型、 数据 类 型 转换 、 代 但 页 转换 和 分 区 键 。 


3. 查询 重 写 


编译 器 使 用 存储 在 查询 图 模型 中 的 全 局 语义 来 将 该 查询 变换 为 更 易于 优化 的 一 种 形 
式 ， 并 将 结果 存储 在 僵 询 图 模型 中 。 例 如 ， 编 详 费 可 能 会 移动 俏 词 ， 更 改 其 应 用 级 别 ， 从 
而 有 可 能 提高 查询 性 能 。 这 种 类 型 的 操作 移动 称 为 一 般 谓词 下 推 。 在 分 区 数据 库 环境 中 ， 
下 列 碍 询 操作 的 计算 更 为 集中 : 

e 聚集 

e 行 的 重新 分 布 

。 相关 子 查询 ， 这 些 子 查询 包含 对 该 子 查询 外 部 的 表 列 的 引用 

对 于 分 区 数据 库 环境 中 的 某 些 查询 而 言 ， 在 重 写 查询 的 过 程 中 ， 可 能 会 发 生 解除 相关 
(decorrelatiom。 在 数据 库 分 区 之 间 移 动 结果 集 的 成 本 很 局 ， 在 但 询 重 与 过 程 中 会 答 试 减 小 
必须 广播 至 其 他 数据 库 分 区 的 内 容 的 大 小 并 且 / 或 减少 广播 次 数 。 


4. 下 推 分 析 

此 步骤 的 主要 任务 是 向 优化 器 建议 是 否 可 在 数据 源 处 对 操作 以 远程 方式 求 值 ( 即 下 
推 )。 这 种 类 型 的 下 推 活动 仅 适 用 于 数据 源 查 询 ， 它 是 对 一 般 谓 词 下 推 操作 的 扩展 。 除 非 执 
行 联合 数据 库 查 询 ， 否 则 绕 过 此 步骤 。 

5. 优化 访问 方案 

以 查询 图 模型 作为 输入 ， 编 译 器 的 优化 器 部 分 生成 可 以 满足 查询 的 多 个 备 选 执行 方 
案 。 优 化 器 综合 使 用 有 关 表 、 索 引 、 列 和 函数 的 统计 信息 来 估算 每 个 备 选 方案 的 执行 成 本 ， 
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然后 选择 具有 最 小 估计 执行 成 本 的 方案 。 优 化 占 使 用 查询 图 模型 来 分 析 查 询 语义 ， 并 获取 
有 关 各 种 因素 的 信息 ， 包 括 索 引 、 基 本 表 、 派 生 的 表 、 子 查询 、 关 联 和 递归 。 

优化 器 还 可 考虑 另 一 类 下 推 操 作 ， 聚 集 ([AVG、SUM、MAX、MIN、COUNT 等 ) 与 排 
序 ， 可 将 这 些 操作 的 求 值 下 推 到 “数据 管理 服务 ”(DMS) 组 件 中 来 提高 性 能 。 

在 确定 页 大 小 选择 时 ， 优 化 器 还 考虑 是 否 有 不 同 大 小 的 缓冲 池 ， 该 环境 是 否 包 括 分 区 
数据 库 ， 以 及 是 和 否 能 够 为 在 对 称 多 处 理 器 (SMP) 环 境 中 实现 分 区 内 并 行 性 改善 选择 的 方案 
均 属 考虑 范围 。 优 化 霹 使 用 此 信息 来 帮助 选择 该 租 询 的 最 佳 访 问 方案 。 

编 详 匿 此 步骤 的 输出 是 访问 方案 。 此 访问 方案 提供 说 明 表 中 捕获 的 信息 。 可 以 用 说 明 
快照 捕获 用 于 生成 该 访问 方案 的 信息 。 


6. 远程 SQL 生成 


优化 器 选择 的 最 终 方 案 可 由 一 组 对 远程 数据 源 执行 操作 的 步骤 组 成 。 对 于 每 个 数据 源 
执行 的 那些 操作 。 这 个 步骤 仅 限 于 联合 数据 库 。 

7. 生成 可 执行 代码 

在 最 后 一 个 步骤 中 ， 编 译 器 使 用 访问 方案 和 查询 图 模型 来 创建 查询 的 可 执行 访问 方案 
或 廊 (SECTION)。 此 代码 生成 步骤 使 用 查询 图 模型 中 的 信息 ， 以 避免 重复 执行 对 一 个 查 
询 只 计算 一 次 的 表达 式 。 这 种 优化 还 适用 于 代码 页 转换 和 绑 定 (人 宿主) 变量 。 

要 对 具有 绑 定 ( 答 主 ) 变 量 、 专 用 寄存 器 或 参数 标记 的 静态 和 动态 SQL 语句 局 用 查询 
(重新 ) 优 化 ， 应 在 绑 定 程序 包 时 使 用 REOPT 绑 定 选项 。 如 果 使 用 此 选项 ， 将 使 用 绑 定 ( 宿 
主 ) 变 量 、 参 数 标记 或 专用 寄存 器 的 值 而 不 是 由 编译 器 选择 的 默认 估计 值 ， 来 优化 属于 该 
程序 包 并 且 包 含 这 些 变 量 的 SQL 语句 的 访问 路 径 。 当 值 可 用 时 ， 执 行 得 询 时 就 会 进行 此 
优化 。 

有 关 静 态 SQL 语句 访问 方案 的 信息 存储 在 系统 目录 表 (SYSCALSTAIEMENTS) 中 。 当 
执行 该 程序 包 时 ,数据 库 管 理 占 将 使 用 存储 在 系统 目录 表 中 的 信息 来 确定 如 何 访问 该 数据 ， 
并 提供 该 查询 的 结果 。 此 信息 也 可 以 由 db2expln 解释 工具 使 用 。 

应 当 在 经 常 更 改 的 表 上 以 适当 的 时 间 间 隔 执 行 RUNSTATS。 优化 费 需 要 有 关 表 及 其 数 
据 的 最 新 统计 信息 以 创建 最 有 效 的 访问 方案 。 可 以 通过 重新 绑 定 应 用 程序 以 利用 更 新 的 统 
计 信 息 。 如 果 示 执行 RUNSTATS 或 优化 器 怀疑 在 空 表 或 几乎 是 空 的 表 上 执行 了 
RUNSTATS， 那 么 优化 器 可 能 使 用 默认 值 或 尝试 根据 在 磁盘 上 存储 该 表 所 用 的 文件 页 的 数 
月 (FPAGES) 来 得 出 特定 的 统计 信息 。 
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7.3 ”优化 器 组 件 和 工作 原理 


理解 DB2 优化 占 的 工作 机 制 对 于 性 能 调 优 古 非 第 乍 要 的 。DB2 优化 带 主 要 由 以 下 3 
种 组 件 构成 : 


1. Query Rewriter( 查 询 重 写 ) 


SQL 是 一 种 非常 灵活 的 查询 语言 , 通常 会 有 很 多 不 同 的 语句 都 是 达到 同一 日 的 ; 有 时 ， 
优化 器 通过 查询 重 写 (Query Rewriter) 会 将 一 种 形式 的 语句 转换 成 男 一 种 形式 ， 前 提 是 第 二 
种 形式 的 语句 执行 起 来 更 有 效 。 


2. Estimator( 成 本 评估 器 ) 


成 本 评估 产生 3 种 度量 标准 : 

e SELECTIVITY: 表示 有 多 少 ROWS 可 以 通过 谓词 被 选择 出 来 , 大 小 介 于 0.0~1.0， 
0 表示 没有 ROW 被 选择 出 来 。 如 果 没 有 收集 统计 信息 (STATISTICS)， 成 本 评估 
佑 (estimator) 会 使 用 默认 的 SELECTIVITY 值 ， 这 个 值 根据 谓词 的 不 同 而 异 。 比 如 
一 ， 的 SELECTIVITY 小 于 '<'。 如 果 有 统计 信息 (STATISTICS), 比如 对 于 “last name 
= 'Smith'”， 成 本 评估 器 使 用 “last name” 列 的 DISTINCT 值 的 倒数 (是 指 表 中 所 
有 “last name” 的 DISTINCT 值 ) 作 为 SELECTIVITY。 

e CARDINALITY: 表示 行 集 (ROW SET) 的 行 数 。 

e COST: COST 表现 了 DISK IO、CPU USAGE 资源 单位 的 使 用 成 本 单位 (timeron)。 


3. Plan Generator( 计 划 生 成 器 ) 
计划 生成 磺 的 作用 是 竹 试 各 种 可 能 的 执行 计划 ， 选 择 成 本 最 低 的 一 种 。 
7.3.1 ”查询 重 写 示 例 : 谓词 移动 、 合 并 和 转换 


在 得 询 重 与 阶段 ， 达 询 编 详 需 将 SQL 语句 变换 为 更 易于 优化 的 格式 , 并 因此 改善 可 能 
的 访问 路 符 。 查 询 重 写 对 于 非常 复杂 的 查询 (包括 具有 许多 子 但 询 或 许多 连接 的 查询 ) 特 别 
重要 。 答 询 生 成 匿 工具 通 音 会 创建 这 些 很 复杂 的 得 询 。 

可 更 改 优化 级 别 来 影 啊 应 用 于 SQL 语句 的 得 询 重 写 规 则 的 数目 。 要 三 看 但 询 重 与 的 一 
些 结果 ， 可 以 使 用 db2expln、dynexpln、db2exfmt 等 工具 。 

可 以 使 用 下 列 3 种 主要 方式 中 的 任何 一 种 租 询 重 写 方式 : 


271 


272 


DB2 数据 库 性 能 调整 和 优化 (第 3 版 ) 


1. 谓词 合并 


要 构造 查询 以 便 它 具有 最 少 的 操作 数 (尤其 是 SELECT 操作 )，SQL 编译 器 查询 重 写 来 
合并 查询 操作 。 以 下 是 谓词 合并 的 一 些 操作 : 

e 视图 合并 : 使 用 视图 的 SELECT 语句 可 限制 表 的 连接 顺序 并 可 引入 表 的 见 余 连接 。 
如 果 在 查询 重 写 期 间 合并 视图 ， 那 么 可 撤销 这 些 限 制 。 

e 子 查 询 至 连接 的 变换 如果 某 条 SELECT 语句 包含 子 查询 ， 那 么 可 以 限制 表 的 顺 
序 处 理 的 选择 。 

e 消除 见 余 连接 : 在 查询 重 写 期 间 ， 可 除去 见 余 连接 来 简化 SELECT 语句 。 

e 共享 聚集 (AVG、MAX、SUM、COUNT 和 MIN): 当 查 询 使 用 不 同 的 函数 时 ， 查 
询 重 写 可 减少 需要 执行 的 计算 数 。 


2. 谓词 移动 


要 构造 具有 最 少数 目的 操作 和 谓词 的 得 询 ， 编 译 器 得 询 重 写 以 移动 但 询 操作 。 以 下 是 
谓词 移动 的 一 些 操作 : 

e 消除 DISTINCT: 在 查询 重 写 期 间 ， 优化 器 可 移动 执行 DISTINCT 操作 的 位 置 ， 从 
而 减少 此 操作 的 成 本 。 在 提供 的 扩展 示例 中 ， 全 部 除去 了 DISTINCT 操作 。 

e 一 般 谓 词 下 推 : 在 碍 询 重 写 期 间 ， 优 化 器 可 更 改 应 用 谓词 的 顺序 ， 以 便 将 选择 性 
更 强 的 谓词 尽早 地 应 用 于 该 查询 。 

e 解除 相关 : 在 分 区 数据 库 环境 中 ， 在 数据 库 分 区 之 间 移 动 结果 集 的 成 本 很 高 。 减 
小 必须 广播 至 其 他 数据 库 分 区 的 信息 的 大 小 和 /或 减少 广播 次 数 ， 是 查询 重 写 的 
目标 。 


3. 谓词 转换 


SQL 编译 需 查 询 重 写 ， 以 便 把 特定 查询 的 现 有 谓词 转换 为 更 优 的 谓词 。 以 下 是 可 进行 
谓词 转换 的 一 些 操作 : 
e 添加 隐 含 谓词 : 在 查询 重 写 期 间 ， 可 以 将 谓词 添加 至 查询 ， 以 允许 优化 器 在 选择 
该 查询 的 最 佳 访 问 方案 时 考虑 其 他 表 连 接 。 
e OR 至 IN 的 变换 : 在 查询 重 写 期 间 ， 可 以 将 OR 谓词 转换 为 IN 谓词 ， 以 获取 更 有 
效 的 访问 方案 。SQL 编译 器 也 可 将 IN 谓词 转换 为 OR 谓词 ,但 前 提 是 此 变换 将 创 
建 一 种 更 有 效 的 访问 方案 。 


查询 重 与 示例 : 视图 合并 
假定 要 访问 EMPLOYEE 表 的 以 下 两 个 视图 : 一 个 视图 显示 受过 局 等 教育 的 职员 ， 
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一 个 视图 显示 工资 超过 35 000 美元 的 职员 。 这 两 个 视图 的 定义 如 下 所 示 : 


CREATE VIEW EMP EDUCATION (EMPNO, FIRSTNME, LASTNAME, EDLEVEL) AS 


SELECT EMPNO, FIRSTNME, LASTNAME, EDLEVEL FROM EMPLOYEE WHERE EDLEVEL 
> 

CREATE VIEW EMP SALARIES (EMPNO, FIRSTNAME, LASTNAME, SALARY) AS SELECT 
EMPNO, FIRSTNME, LASTNAME, SALARY FROM EMPLOYEE WHERE SALARY > 32000 


现在 ， 假 定 执行 下 面 的 语句 ， 得 询 既 受过 高 等 教育 且 工 资 又 超过 35 000 美元 的 职员 : 


SELECTI 了 .EMPNO, El.FIRSTNME, El .LASTNAME, El .EDLEVEL, E2.SALARY 
FROM EMP EDUCATION El, EMP SALARIES Ez WHERE El .EMPNO = E2 .EMPNO 


在 优化 此 合 询 香 与 期 间 ， 可 合并 这 册 个 视图 来 创建 下 和 耐 这 个 合 询 : 


SELECT El .EMPNO, El.FIRSTNME, El .LASTNAME, El .EDLEVEL, E22 .SALARY F ROM 
EMPLOYEE El, EMPLOYEE E2 WHERE El .EMPNO = E22 .EMPNO AND El .EDLEVEL 
> | AND E22.SALARY > 35000 

re et pe eee et ese 
择 访 问 方案 时 可 考虑 更 多 选项 。 此 外 ， 如 果 已 合并 的 这 两 个 视图 使 用 相同 的 基本 表 ， 还 
执行 其 他 重 写 。 

4. 查询 重 写 示例 : 子 查询 至 连接 的 变换 

SQL 编译 器 将 执行 包含 子 查 询 的 查询 ， 例 如 下 面 这 条 SQL 语句 : 

SELECT EMPNO, FIRSTNME, LASTNAME, PHONENO FROM EMPLOYEE WHERE 
WORKDEPT IN (SELECT DEPTNO FROM DEPARTMENT 


WHERE DEPTNAME = “OPERATIONS ") 


将 之 转换 为 如 下 形式 的 连接 查询 : 


SELECT DISTINCT EMPNO, FIRSTNME, LASTNAME, PHONENO FROM EMPLOYEE 上 ME ， 
DEPARTMENT DEPT WHERE EMP .WORKDEPT = DEPT .DEPTNO AND DEPT .DEPTINAME = 
‘OPERATIONS' 


一 般 情况 下 ， 连 接 是 基于 集合 操作 的 ， 而 子 查 询 是 基于 行 集 (rows seb 操 作 的 ， 所 以 连 
接 的 执行 效率 比 子 查询 高 很 多 。 


查询 重 写 示例 : 消除 宛 余 连接 
有 时 编写 或 生成 的 查询 可 能 含有 不 需要 的 连接 。 在 查询 重 写 期 间 ， 也 可 能 产生 类 似 下 
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面 的 租 询 : 
SELECT El.EMPNO, El.FIRSTNME, El .LASTNAME, El .下 DELEVETL， E2.SALARY 
FROM EMPLOYEE El, EMPLOYEE FE2 WHERE El.EMPNO = E2 .EMPNO 
AND El] .EDLEVEL > 11 AND E2.SALARY > 32000 
在 此 坦 询 中 ，SQL 编译 项 可 消除 连接 并 将 得 询 简化 成 如 下 形式 : 
SELECT EMPNO, FIRSTNME, LASTNAME, EDLEVEL, SALARY FROM EMPLOYEE 
WHERE EDLEVEL > 1] AND SALARY > 32000 


另 一 个 示例 假设 具有 该 部 门 号 的 EMPLOYEE 和 DEPARTMENT 样本 表 之 间 存 在 参考 
约束 。 首 先 ， 创 建 一 个 视图 。 该 视图 定义 如 下 : 


CREATE VIEW PEPLVIEW AS SELECT EIRSTNME, LASTNAME, SALARY, DEPTNO, EPTNAME., 
MGRNO FROM EMPLOYEE E DEPARTIMENT D WHERE E.WORKDEPT = D.DEPTNO 


于 是 ， 诸 如 以 下 内 容 的 查询 ; 
SELECT LASTNAME, SALARY FROM PEPLYVLIEW 

将 变 成 如 下 所 示 : 
SELECT LASTNAME, SALARY FROM EMPLOYEE WHERE WORKDEPT NOT NULL 


注意 ， 在 这 种 情况 下 ， 即 使 用 户 知道 可 重新 编写 查询 ， 他 们 可 能 也 无 法 这 样 做 ， 因 为 
ao 他 们 可 能 只 对 以 上 显示 的 视图 具有 访问 权 。 因 此 ， 必 须 在 数据 
库 管 理 器 内 执行 这 种 类 型 的 优化 。 


查询 重 写 示 例 : 共享 聚集 (AVG、MAX、SUM、COUNT 和 MIN) 
EN A A 这 会 占用 时 间 。 将 要 在 碍 询 中 执行 的 计算 数 
减少 可 改进 方案 。SQL 编译 器 执行 使 用 多 个 函数 的 和 查询， 例如 下 面 这 条 SQL 查询 : 


SELECT SUM(SALARY+BONUS+COMM) AS OSUM, AVG (SALARY+BONUS+COMM) AS OAVG ， 
COUNT (*) AS OCOUNT FROM EMPLOYEE ; 


优化 占用 下 列 方式 变换 该 伍 询 如 下 : 


SELECT OSUM,OSUM/OCOUNT OCOUNT FROM (SELECT SUM'(SALARY+BONUS+COMM) AS 
OQSUM, COUNT (*) AS OCOUNT FROM EMPLOYEE) AS SHARED AGG; 


此 重 写 将 该 查询 从 2 次 求 和 2 次 计数 减少 为 1 次 求 和 1 次 计数 。 
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查询 器 重 写 示例 : 消除 DISTINCT 
如 果 EMPNO 列 被 定义 为 EMPLOYEE 表 的 主键 ， 那 么 以 下 查询 : 


SELECT DISTINCT EMPNO, FIRSTNME, LASTNAME FROM EMPLOYEE 
将 通过 除去 DISTINCT 子 句 重 写成 如 下 形式 : 
SELECT EMPNO, FIRSTNME, LASTNAME FROM EMPLOYEE 
在 以 上 示例 中 ， 由 于 选择 了 主键 ， 因 此 SQL 编译 器 知道 返回 的 每 一 行 已 经 是 唯一 的 。 


在 这 种 情况 下 ，DISTINCT 关键 字 是 多 余 的 。 如 果 未 重 写 该 查询 ， 那 么 优化 器 将 需要 通过 
必要 的 处 理 (例如 排序 ) 来 构建 一 种 方案 ， 从 而 确保 这 些 列 是 相 弄 的 。 


查询 重 与 示例 : 谓词 下 推 

改变 谓词 通 闸 应 用 的 级 别 可 改善 性 能 。 例 如 ， 假 定 以 下 视图 所 供 部 门 “D11” 中 所 有 
职员 的 列表 ， 该 视图 定义 如 下 : 

CREATE VIEW D11 EMPLOYEE (EMPNO, FIRSTNME, LASTNAMF, PHONENO, SALARY, BONUS 


COMM) AS SELECT EMPNO, FIRSTNME, LASTNAME, PHONENO, SALARY, BONUS, COMM 
FROM EMPLOYEE WHERE WORKDEPT = "D11' 


并 假定 执行 以 下 查询 : 

SELECT FIRSTNME, PHONENOG FROM DT EMPLOYEE WHERE LASTNAME, = "BROWN' 

在 编译 器 的 查询 重 写 阶段 将 把 谓词 LASTNAME='BROWN 下 推 到 视图 
Dll EMPLOYEE 中 。 这 使 得 可 以 更 快 并 可 能 更 有 效 地 应 用 该 谓词 。 在 本 例 中 可 能 执行 的 
实际 查询 转变 为 : 

SELECT FIRSTNME,, PHONENO FROM EMPLOYEE 

WHERE LASTNAME = "BROWN' AND WORKDEPT = "Dl11'" 

谓词 下 推 并 不 限于 视图 。 可 以 下 推 谓词 的 其 他 情况 包括 UNION、GROUP BY 和 派生 
的 表 ( 嵌 套 表 表达 式 或 公共 表 表 达 式 )。 

查询 器 重 写 示例 : 隐 含 谓词 

以 下 但 询 产 生 所 属 部 门 是 则 “E01” 报 告 的 经 理 的 列表 ， 以 及 那些 经 理 所 负 责 的 项 目 
的 列表 : 

SELECT DEPT .DEPINAME DEPT .MGRNO, EMP.LASTNAME, PROJ .PROJNAME, FROM 


DEPARTMENT DEPT, EMPLOYEE EMP, PROJECT PROJ 
WHERE DEPT.ADMRDEPT = "EOL1' AND DEPT .MGRNO = EMP .EMPNO 


r 
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AND EMP .EMPNO = PROJ.RESPEMP 
优化 需 将 该 SQL 符 询 重 与 并 添加 以 下 隐 含 谓词 : 
DEPT .MGRNO = PROJ.RESPEMP 


作为 此 得 询 重 写 的 结果 ， 优 化 套 在 尝试 选择 该 得 询 的 最 佳 访 问 方 案 时 可 以 考虑 其 他 连接 。 
除 以 上 谓词 传递 财 包 外 ， 碍 询 重 写 还 根据 等 陈 谓词 隐 舍 的 传递 性 派生 其 他 的 本 地 育 
词 。 例 如 ， 以 下 查询 将 列 示 部 门 号 大 于 “E00” 的 部 门 和 在 这 些 部 门 工 作 的 职员 的 名 称 : 


SELECT EMPNO, LASTNAME, FIRSTNAME, DEPTNO, DEPTNAME, 
FROM EMPLOYEE EMP, DEPARTIMENT DEPT 
WHERE EMP .WORKDEPT = DEPT.DEPINO AND DEPT.DEPTNO > “EUOU- 


对 于 此 程 询 ， 该 重 写 阶 段 添 加 以 下 隐 含 谓词 ; 

EMP .WORKDEPT > "EOO"' 

作为 此 查询 重 写 的 结果 ， 优 化 器 会 减少 要 连接 的 行 数 。 

查询 重 写 示例 : OR 至 IN 的 变换 

假定 OR 子 名 根据 同一 列 将 两 个 或 更 多 个 简单 的 等 式 谓 词 相连 ， 如 下 面 的 SQL 会 询 : 


SELECT * FROM EMPLOYEE 
WHERE DEPTNO = DLL OR DEPTNO = “D21" OR DEPTNO = "E21" 


如 果 DEPTNO 列 上 没有 索引 ， 束 将 OR 子 句 转换 为 以 下 IN 谓词 以 允许 更 有 效 地 处 理 
该 查询 : 


Sibel FROM EMPLOYEE WHERE DEPTNO JIN (DI, “Dal "Ezl") 


在 某 些 情况 下 ， 数 据 库 管理 器 可 以 将 IN 谓词 转换 为 一 组 OR 子 句 ， 以 便 执行 索引 
OR(IndexORing) 运 算 。 


7.3.2 ”优化 器 成 本 评估 
成 本 评估 产生 3 种 度量 标准 : 
1. SELECTIVITY 


表示 有 多 少 比 例 的 ROWS 可 以 通过 谓词 被 选择 出 来 ， 大 小 介 于 0.0~1.0，0 表示 没有 
ROW 被 选择 出 来 。 如 果 没 有 收集 统计 信息 (STATISTICS)， 成 本 评估 器 会 使 用 默认 的 
SELECTIVITY 值 ， 这 个 值 根据 谓词 的 不 同 而 异 。 比 如 =" 的 SELECTIVITY 小 于 '<'"。 如 
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果 有 统计 信息 (STATISTICS)， 比 如 对 于 “last name ='Smith'”, 成 本 评估 器 使 用 “last name” 
列 的 DISTINCT 值 的 倒数 (是 指 表 中 所 有 “last name ”的 DISTINCT 值 ) 作 为 SELECTIVITY。 

如 果 last name 列 上 有 分 布 统计 信息 ， 就 使 用 分 布 统计 信息 根据 last name 值 的 分 布 情 
况 产 生 的 SELECTIVITY 作为 SELECTIVITY。 分 布 统计 信息 在 当 列 有 数据 分 布 不 均 勾 时 
可 以 大 大 帮助 CBO 产生 好 的 SELECTIVITY。 


2. CARDINALITY 


表示 行 集 (rows set) 的 行 数 ， 分 为 以 下 几 种 : 


base cardinality: base table 的 行 数 。 如 果 表 的 统计 信息 收集 过 了 了， 就 直接 使 用 统计 
信息 。 如 果 没 有 ， 束 使 用 表 extents 的 数量 来 估计 。 

effective cardinality: 有 效 行 集 ， 是 指 从 基 表 中 选择 出 来 的 行 数 。 是 base cardinality 
和 表 上 上 所 有 谓词 的 组 合 selectivity 的 乘积 。 如 果 表 上 没有 谓词 ， 那 么 effective 
cardinality=base cardinality。 

join cardinality: 两 表 join 后 产生 的 行 数 。 是 两 表 cardinality 的 乘积 (Cartesian) 乘 以 
join 袁 词 的 selectivity。 

distinct cardinality: 列 上 distinct 值 的 行 数 。 

group cardinality: GROUP BY 操作 之 后 row set 的 行 数 。 由 grouping columns 的 
distinct cardinality 和 整个 row set 的 行 数 决 定 。 


3. COS 


COST 表现 了 DISK IO、CPU USAGE 资源 单位 的 使 用 成 本 单位 (timeron)。 扫 摘 方式 
决定 从 基 表 (base table) 中 获得 数据 所 需 的 资源 单位 的 使 用 数量 (units of work or resource 
used)。 也 就 是 说 , 扫描 方式 决定 COST 的 值 。 扫 摘 方 式 可 以 是 TABLE SCAN. INDEX SCAN 
和 RID SCAN。 

DB2 优化 需 攒 依 精 确 的 基数 成 本 评估 值 来 准确 计算 出 每 个 待定 查询 访问 计划 的 成 本 。 
基数 成 本 评估 是 这 样 一 种 过 程 : 在 应 用 了 谓词 或 执行 了 聚集 之 后 ， 优 化 髓 使 用 统计 信息 确 
定 部 分 查询 结果 的 大 小 。 对 于 访问 计划 的 每 个 操作 符 ， 优 化 器 将 估计 操作 符 的 基数 输出 。 
应 用 一 个 或 更 多 谓词 可 以 减少 输出 流 基 数 。 基 数 估 计 通 过 不 同 谓词 的 选择 性 经 过 计算 得 到 
最 终 估 计 的 行 数 。 


Fi 


本 地 谓词 基数 (cardinality) 估 计 


我 们 假设 表 Tl 有 和 X、Y 列 ， 总 行 数 为 20， 并 且 表 T1 在 买 列 上 索引 。T1 表 的 分 布 情 


帝 如 下 : 
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DOWD w 
ON TD 必 


Ca 
> AD 
人 


60 
我 们 已 经 执行 下 面 的 RUNSTATS， 收 集 了 表 TI1 的 统计 信息 : 


db2 runstats on table db2admin.t]1 WITH DISTRIBUTION AND SAMPLED DETAILED 
INDEXES ALL 


现在 我 们 希望 执行 下 面 的 SQL 语句 : 
SELECT * FROM T] WHERE x BETWEEN 10 AND 50 AND > 人 


对 谓词 “BETWEEN 10 AND 50”， 我 们 首先 看 X<=50 的 选择 性 。 由 于 50 处 于 第 18 
个 值 ， 因 此 选择 性 为 18/20=0.9。 

对 于 X>=10， 由 于 10 不 在 表 工 1 的 数据 中 ， 而 第 1 个 小 于 10 的 数 为 9， 处 在 数据 分 布 
的 第 4 个 位 置 ， 因 此 选择 性 为 (20 - 4)/20 二 0.8。P1 谓词 的 整个 选择 性 为 0.8X 0.9=0.72。 

我 们 的 执行 计划 是 先 应 用 索引 扫描 ， 并 应 用 “x BETWEEN 10 AND 50” 谓 词 ， 由 此 产生 
的 基数 估计 为 20X0.72=14。 

对 Y='a' 谓 词 ，RUNSTATS 显示 立 有 5 个 不 同 的 值 ，Y = 'a' 谓 词 的 选择 性 为 1/5=0.2。 
在 应 用 完 第 1 个 谓词 的 基础 上 再 应 用 第 2 个 谓词 产生 的 基数 估计 是 14X0.2=2.8。 

对 于 整个 查询 ， 优 化 器 产生 的 基数 估计 是 2.8， 这 与 3 行 的 实际 输出 结果 接近 。 实 际 


第 7 章 DB2 优化 器 


输出 结果 如 下 所 示 : 
$sdb2 "SELECT * FROM Tl1 WHERE x BETWEEN 10 AND 50 AND y= "an 
放 
31] a 
43 已 


下 面 是 db2exfmt 输出 的 执行 计划 : 


ROWS 
RETURN 
[9 
CGSt 
T7O 
2 .8 - 注 ， 2.8 为 应 用 y = 'a' 和 x BETWEEN 10 AND 50 产生 的 基数 估计 


Bee 
( 2) 
7.59383 
i 
人 
14 2 - 注 ，14 为 应 用 x BETWEEN 10 AND 50 产生 的 基数 估计 
IXSCAN TABLE: DB2ADMIN 
39 Tl 
0.0228255 
0 
| 
20 
INDEX: DB2ADMIN 
TN 区 


7.3.4 连接 基数 (cardinality) 估 计 
假设 有 表 TI1、T2， 数 据 分 布 如 下 : 


于 下 之 
A 工 汗 
] A B 
eB B 
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DD 下] J] 直人 N 
El 


EE 
An 


假设 有 以 下 得 询 : 
SELECTIT * FROM Tl1, T2 WHERE Tl1l.X = / AND TL-Y = T2.Y 


这 个 查询 有 两 个 谓词 : 一 个 是 本 地 谓词 , 应 用 于 本 地 查询 上 的 谓词 我 们 称 为 本 地 谓词 ， 
第 2 个 谓词 是 在 了 Y 列 上 做 连接 操作 。 

对 于 T1.X=7 谓 词 ， 由 于 7 这 个 值 是 使 用 频率 最 高 的 值 ， 因 此 它 的 使 用 频率 会 被 分 布 
统计 信息 收集 到 ， 计 算得 到 选择 性 为 4/10=0.4。 在 上 述 例子 中 ， 如 果 没 有 收集 入 列 的 分 布 
统计 信息 ， 那 么 Tl1.X=7 的 选择 性 是 /DISTINCT CARD=1/5=0.2。 所 以 如 果菜 列 上 的 数据 
分 布 不 均匀 ， 建 议 收集 该 列 的 分 布 统计 信息 。 

在 估计 Tl.Y = T2.Y 谓词 时 假设 : 

e 上 所 有 T2.Y 值 都 被 包含 在 Tl.Y 中 。 

e 两 个 表 中 的 列 值 是 均匀 分 布 的 。 

计算 是 首先 检 枉 每 个 表 的 Y 值 的 唯一 值 个 数 ， 在 我 们 的 例子 中 ，T1l 表 的 站 列 含 有 10 
个 不 同 佣 ，T2 表 包 合 5 个 不 同仁 。 

连接 谓词 的 选择 性 算法 是 : 

Selectivity (Tl1.A = T2.A) := 1 / max(colcard(T1l.A), colcard(T2.A)) 

在 本 例 中 : 

Selectivity (Tl.y = T2.y)=1/max(10,5)=0.1 
内 此 整个 谓词 的 基数 估计 是 : 

Result cardinality=Card (Tl}) * Card(T2) * sel(Tl .x=71) * sel(Tl.y T2.Y) 

= 
= 4 
这 与 4 行 的 实际 输出 结果 相同 。 和 实际 输出 结果 如 下 所 示 : 


sdb2 "SELECT * FROM Tl1, T2 WHERE Tl1.x = 7 AND Tl.y = T2.Yy" 
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一 省略 …...... 
4 - 注 : 4 是 应 用 谓词 T2."Y" = T1."Y" 估 计 的 基数 
HSJOIN 
2 
15.1688 
We 0 \ 
10 4 - 注 ， 4 是 应 用 谓词 T1.x = 7 估计 的 基数 
TBSCAN TBSCAN 
(0 ( 4) 
7.58326 7.58475 
ES 省 略 .…... 


如 果 上 面 的 假设 人 不成立， 会 出 现 什么 结 来 呢 ? 我 们 假设 Tl 表 数 据 不 变 ，T2 表 发 生变 
化 ， 如 下 所 未 : 


[DD 
Ei ee Gl ty 
a 


这 样 就 不 满足 刚才 那 两 个 假设 : 
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e 首先 Tl.Y 没有 被 完全 包含 在 T2.Y 中 ， 只 有 A 和 下 被 包含 。 同 样 T2.Y 也 没有 被 
完全 包含 在 Tl.Y 中 。 

e TIT2Y 的 列 数 据 分 布 不 均匀 ，A 束 占 了 50%。 

对 于 下 面 的 查询 : 


SEGECT  * FROM Ti: TZ WHERE TIE- = 1 AND TI YY — TZ2-Y 


对 于 谓词 Tl1.X = 1， 由 于 1 不 是 最 常 出 现 的 值 ， 没 有 被 收集 频率 统计 信息 ， 因 此 直接 
使 用 1 作为 出 现 频率 估计 ， 选 择 性 为 /DISTINCT CARDINALITY =1/10=0.1。 

对 于 Tl1.Y 一 T2.Y， 依 然 杀 用 上 和 面 的 方法 计算 得 到 选择 性 为 I(MAX(10.4) )=0.1。 

整个 查询 估计 的 基数 是 : 


Result cardinality 

-ard 7 Cardft2z 9 ™ selrrl SG ”el1T|l NT = Y) 
| 

= 1 


这 与 实际 查询 结果 为 5 条 严重 不 符合 ， 错 误 率 为 80%。 该 查询 的 输出 结果 如 下 所 示 : 


sdb2 "SELECT * EFROM TI T2 WHERE TI1I:x= 1 AND TY = TZ 
4 计生 


DB BH 


5 条 记录 已 选择 。 


在 这 种 情况 下 ， 我 们 再 要 考虑 JOIN 完成 之 后 的 数据 分 布 情况 以 纠正 错误 估计 。 如 来 
优化 句 知 道 了 表 的 数据 分 布 信息 ， 优 化 避 束 能 正确 估计 基数 。 比 如 下 和 面 的 SQL 语句 : 


SELECT * FROM T1，T2 WHERE Tl].y = T2.y 
此 僵 询 的 输出 结果 如 下 所 示 : 


Sdb2 "SRLECT * FROM TI, T2 WHERE Tl y= To,y" 


从 Ls 
1 nA 
1 AA 
1 nA 
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1 nx 
I 
7 FF 


6 条 记录 已 选择 。 


执行 select distinct x as COLVALUE,count(*) as VALCOUNT from (SELECT * FROM T], 
T2 WHERE Tl.y = T2.y)， 这 样 就 可 以 得 到 中 间 结 果 集 义 列 的 分 布 如 下 : 
COLVALUE VALCOUNT 


1 要 
1 i 


对 于 谓词 (Tl1.x = 1)AND (Tl.y = T2.y)， 估 计 基 数 为 : 
Result cardinality 


= ard(tTl On T2}Y * sel(TT.x = 1) 


对 于 谓词 (Tl1.x =7) AND (Tl.y = T2.y)， 估 计 基 数 为 : 


Result cardinality: 
= CardiTl arn T2}y * Sel{Tl x — 7) 
= 6* 1/6=l1 


这 两 种 与 实际 结果 束 完 全 一 致 了 。 
7.3.5 分布 统计 信息 

在 上 面 的 例子 中 ， 当 我 们 应 用 Tl1.X=7 来 选取 数据 时 ， 优 化 器 默认 认为 Tl1.X 列 的 数据 
分 布 是 均匀 的 ， 所 以 这 种 情况 下 优化 器 评估 的 基数 (CARDINALITY) 是 /DISTINCT。 但 实 
际 上 Tl.X 列 的 数据 分 布 是 不 均匀 的 ， 这 种 情况 下 优化 器 评估 出 来 的 基数 估计 就 不 准确 了 。 
当 确 定 表 中 数据 分 布 不 均匀 时 ， 可 以 运行 包含 WITH DISTRIBUTION 子 句 的 RUNSTATS 
命令 。 系 统 目 录 表 中 的 统计 信息 通常 包含 关于 表 中 最 高 值 和 最 低 值 的 信息 ， 而 优化 器 假定 


数据 值 是 在 两 个 端点 值 之 间 均 匀 分 布 的 。 然 而 ， 如 果 数 据 值 的 分 布 彼此 之 间 差 异 较 大 ， 或 
者 群集 在 某 些 点 上 , 或 者 碰 到 许多 重复 的 数据 值 , 那么 优化 器 就 无 法 选择 最 佳 的 访问 路 径 ， 


除非 收集 了 分 布 统计 信息 ,使 用 WITH DISTRIBUTION 子 句 还 可 以 帮助 查询 处 理 没有 参数 
标记 或 主机 变量 的 谓词 , 因为 优化 器 仍然 不 知道 运行 时 的 值 是 有 许多 行 , 还 是 只 有 少数 行 。 
可 以 收集 两 种 数据 分 布 统计 信息 : 
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1. 频率 统计 信息 


这 些 统计 信息 提供 关于 num freqvalues 数据 库 配置 参数 的 值 所 指定 级 别 的 具有 最 高 重 
复 值 的 数目 和 次 高 重复 值 的 数目 的 列 和 数据 值 的 信息 。 默 认 值 是 10， 建 议 将 这 个 值 设置 在 
10~100 之 间 。 如 果 将 num freqvalues 设置 为 索 ， 那 么 不 体 留 任何 频率 值 的 统计 信息 。 还 可 
以 将 num freqvalues 设置 为 每 个 表 、 统 计 信 息 视图 和 特定 列 的 RUNSTATS 选项 。 


2. 分 位 数 统计 信息 


这 些 统计 信息 提供 天 于 与 其 他 值 相 比 如 何 分 布 数据 值 的 信息 。 称 为 分 位 数 ， 这 些 统 
计 信 息 表 示 值 V, 全 少 个 值 位 于 该 值 或 该 值 以 下 。 可 以 通过 按 升 序 排 友 值 来 计算 KK 分 位 
数 。K 分 位 数值 是 从 范围 的 低 闹 起 第 K 个 位 置 中 的 值 。 

要 指定 应 该 将 列 数据 值 分 组 成 的 部 分 数 ,将 num_quantiles 数据 库 配 置 参 数 设 置 为 2~32 
767 之 间 的 条 个 值 。 默 认 值 为 20， 确 保 对 任何 相等 或 小 于 或 大 于 谓词 的 优化 占 估 计 误 左 最 
大 为 正 或 负 2.5%， 而 对 任何 BETWEEN 谓词 的 最 大 误差 为 正 或 负 5%。 要 共用 分 位 数 统计 
信息 收集 ， 将 num quantiles 设置 为 0 或 1。 可 以 对 每 个 表 或 统计 信息 视图 以 及 特定 列 设 


num quantiles。 


注意 : 

如 果 没 有 在 RUNSTATS 命令 的 列 或 表 级 别 上 指定 num freqvalues 和 num quantiles， 
那么 num freqvalues 的 值 将 从 num freqvalues 数据 库 配 置 参 数 中 获取 , 而 num quantiles 的 
值 将 从 num quantiles 数据 库 配 置 参数 中 获取 。 如 果 指 定 了 较 大 的 num freqvalues 和 
num quantiles 值 ， 那 么 执行 runstats 时 将 需要 更 多 CPU 资源 和 内 存 ， 此 时 可 以 通过 
stat heap sz 数据 库 配 置 参 数 来 增加 可 用 的 内 存量 。 


可 以 为 单个 列 或 一 组 列 修改 频率 和 分 位 数 统计 信息 的 精确 度 。 提 高 分 布 统 计 信 息 的 精 
确 度 将 导致 更 大 的 CPU 和 内 存 消 耗 ， 并 占用 更 多 的 系统 目录 表 衬 间 。 对 于 这 些 分 布 统计 
信息 ， 只 考 碟 对 拥有 选择 谓词 的 最 重要 的 得 询 而 言 最 为 重要 的 列 。 

当 出 现下 列 任何 一 种 条 件 时 ，RUNSTATS 将 不 收集 分 布 统计 信息 : 

e 当 将 num freqvalues 配置 参数 设置 为 0， 以 及 将 num quantiles 数据 库 配 置 参 数 设 
置 为 0 或 1 时 。 
当 每 个 数据 值 是 唯一 的 时 候 。 
当 该 列 是 LONG、LOB 或 结构 化 列 时 。 
如 果 列 中 只 大 一 个 非 空 值 。 
声明 的 临时 表 ，。 
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何 时 收集 分 布 统计 信息 

要 决定 是 否 应 创建 和 更 新 给 定 表 或 统计 信息 视图 的 分 布 统计 信息 ， 考 虑 以 下 两 个 
因 了 对: 

(1) 应 用 程序 是 否 使 用 静态 或 动态 SQL 和 XQUERY 语句 。 

分 布 统计 信息 对 不 使 用 宿主 变量 的 动态 查询 和 静态 查询 最 有 用 。 当 使 用 具有 宿主 变 
量 的 但 询 时 ， 优 化 器 只 能 有 限 地 利用 分 布 统计 信息 。 

(2) 列 中 的 数据 是 否 是 均匀 分 布 的 。 

如 果 表 中 至 少 有 一 列 的 数据 分 布 非常 “不 均匀 ” 并 且 该 列 频繁 出 现在 等 式 或 范围 谓 
词 中 。 比 如 ， 在 类 似 如 下 所 示 的 子 名 中 ， 考 虑 收集 分 布 统计 信息 : 


WHERE Cl = KEY; 

WHERE C1 IN (EEYI, KEY2, KEY3); 

WHERE (Cl = KEY1)} OR (Cl = KEY2) OR (Cl = KEY3}); 
WHERE C1 <= FEY 

WHERE C BETWEEN KEY] AND KEY2; 


可 能 发 生 两 种 类 型 的 不 均匀 数据 分 布 (可 能 一 起 发 生 ): 
。 可 能 按 一 个 或 多 个 子 间隔 集群 数据 ， 而 不 是 均匀 地 在 最 高 和 最 低 数据 值 之 间 分 布 。 
考虑 以 下 列 ， 其 中 ， 数 据 在 范围 (5,10) 内 集群 ， 该 列 的 数据 分 布 如 下 所 示 : 


分 位 数 统计 信息 可 以 帮助 优化 颖 处 理 这 种 类 型 的 数据 不 均匀 分 布 。 
要 帮助 确定 十 否 个 古 均匀 分 布 的 列 数据 ， 执 行 如 下 僵 询 : 
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SELECT Cl, COUNT(*) AS OCCURRENCES FROM Tl GROUP BY Cl 
ORDER BY OCCURRENCES DESC; 


e 车 复数 据 值 可 能 经 名 出 现 。 考 虑 使 用 下 列 频 率 分 布 数 据 的 列 : 


数据 值 频率 
20 

30 10 
40 10 
50 
60 35 
70 20 
80 5 


要 帮助 优化 右 处 理 午 复 人 从， 可 以 创建 分 位 数 和 局 频 值 统计 信息 。 


要 指定 哪个 级 别 的 统计 精度 

要 确定 存储 分 布 统计 信息 使 用 的 精度 ， 指 定数 据 库 配 置 参 数 num quantiles 和 
num 位 eqvalues。 还 可 以 指定 这 些 参数 作为 收集 表 或 列 的 统计 信息 时 的 RUNSTATS 选项 。 
这 些 值 设 置 得 越 局 ，RUNSTIATS 创建 和 更 新 分 布 统计 信息 时 使 用 的 精度 越 大 。 但 是 ， 精 度 
越 大 ， 在 RUNSTATS 执行 期 间 和 在 目录 表 中 所 需要 的 存储 器 中 需要 使 用 的 资源 束 越 多 。 

对 于 大 多 数 数据 库 , 为 num freqvalues 数据 库 配 置 参 数 指定 10~100 之 间 的 数 。 理 论 下 ， 
应 创建 高 频 值 统计 信息 ， 以 便 其 余 值 的 频率 可 近似 等 于 最 高 频 值 的 频率 ， 或 者 相 比 之 下 忽 
略 不 计 。 数 据 库 管 理 器 收集 的 数目 可 能 低 于 此 数 ， 因 为 只 对 出 现 多 次 的 数据 值 收 集 这 些 统 
计 信 息 。 如 果 需 要 只 收集 分 位 数 统 计 信 息 ， 那 么 将 num freqvalues 设置 为 0。 

要 设置 分 位 数 的 数目 ,指定 20~50 之 间作 为 num quantiles 数据 库 配 置 参 数 的 设置 。 确 
定 分 位 数 数 目的 经 验方 法 为 : 

e 确定 在 估计 任何 范围 租 询 的 行 数 时 可 人 允许 的 最 大 销 误 上 分 比 。 

e 如 朱 谓 词 是 BETWEEN,， 那么 分 位 数 的 数目 应 近似 为 100/P; 如 各 谓词 是 任何 其 他 

关 型 的 范 围 谓词 <、 一 、> 或 >=)， 那 么 分 位 数 的 数目 应 近似 为 50/P。 

例如 ，25 个 分 位 数 导 臻 的 最 大 估计 簿 误 对 于 BETWEEN 谓词 应 为 4%， 而 对 于 “>” 
谓词 则 应 为 2%。 通 第 ， 全 少 指定 10 个 分 位 数 。 对 于 极 痛 不 均匀 的 数据 才 需 要 50 个 以 上 
的 分 位 数 。 如 果 只 需要 融 频 值 统 计 信 息 ， 那 么 将 num quantiles 设置 为 0。 如 果 将 此 参数 设 
置 为 “1”， 那 么 因为 值 的 整个 范围 适合 分 位 数 ， 因 此 不 收集 分 位 数 统计 信息 。 
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收集 特定 列 的 分 布 统计 信息 

为 了 提高 RUNSTATS 和 后 续 和 但 询 方案 分 析 的 效率 ， 可 以 仅 收 集 得 询 在 WHERE、 
GROUP BY 和 类 似 子 句 中 使 用 的 列 的 分 布 统计 信息 。 还 可 以 收集 关于 列 的 列 组 的 基数 统计 
信息 。 优 化 器 使 用 这 种 信息 来 在 它 为 引用 组 中 列 的 查询 估计 选择 性 时 检测 列 相 关 。 

RUNSTATS 仅 收 集 执行 该 命令 的 数据 库 分 区 上 的 表 的 统计 信息 。 将 此 数据 库 分 区 的 
RUNSTATS 结果 推广 到 其 他 数据 库 分 区 。 如 果 执 行 RUNSTATS 的 数据 库 分 区 不 包含 表 的 
一 部 分 ， 那 么 将 请 求 发 送 到 数据 库 分 区 组 中 持 有 表 的 该 部 分 的 第 1 个 数据 库 分 区 。 

下 面 举 一 些 收 集 特定 列 的 分 布 统计 信息 的 例子 。 

下 列 示 例 说 明 使 用 RUNSTATS 来 收集 包含 数据 分 布 信息 的 系统 目录 表 统 计 信 息 的 不 
同方 于 ， 

收集 表 和 索引 上 的 数据 库 统 计 信 息 ， 包 含 分 布 统计 信息 : 


RUNSTATS ON TABLE db2inst1.account WITH DISTRIBUTION AND INDEXES ALL 
收集 表 上 的 数据 库 统 计 信息 以 及 索引 上 的 详细 统计 信息 ， 包 含 分 布 统计 信息 : 
RUNSTATS ON TABLE db2inst1.account WITH DISTRIBUTION AND DETAILED INDEXES ALL 


总 的 来 说 ， 分 布 统计 信息 对 处 理 不 均匀 的 数据 分 布 非 浊 有 好 处 ， 可 以 让 优化 融 更 好 地 
选择 最 优 的 执行 计划 。 


7.3.6 ” 列 组 统计 信息 对 基数 的 影响 


列 组 (COLUMN GROUP) 统 计 信 息 将 获得 一 组 列 的 不 同 值 组 合 的 数 上 日。 通常 ，DB2 优 
化 器 可 用 的 基本 统计 信息 不 检测 数据 相关 性 。 列 组 的 使 用 将 给 多 个 谓词 的 联合 选择 提供 更 
准确 的 基数 估计 ,优化 副 先 信 精 确 的 基数 估计 (ESTIMATED CARDINALITY) 值 来 准确 计算 
出 每 个 待定 查询 访问 计划 的 成 本 。 基 数 估 计 是 这 样 一 种 过 程 : 在 应 用 了 谓词 或 执行 了 聚集 
之 后 ， 优 化 器 使 用 统计 信息 确定 部 分 查询 结果 的 大 小 。 对 于 访问 计划 的 每 个 操作 符 ， 优 化 
器 将 估计 该 操作 符 的 基数 输出 。 应 用 一 个 或 更 多 谓词 可 以 减少 输出 的 基数 。 

在 计算 谓词 对 于 基数 估计 值 的 组 合 过 小 效果 时 ， 通 常会 假设 这 些 谓词 彼此 之 间 是 独立 
的 。 但 在 统计 方面 ， 这 些 谓词 可 以 彼此 关联 。 单 独 地 处 理 多 个 谓词 通常 会 导致 优化 器 低估 
基数 值 ， 而 基数 值 的 低估 又 会 导致 优化 器 选择 次 优 的 访问 计划 。 

优化 器 会 考虑 使 用 多 列 统 计 信 息 来 检测 统计 关联 ， 并 更 加 准确 地 估计 多 个 谓词 组 合 的 
过 滤 效 果 。 下 面 讲述 优化 器 如 何 利用 多 列 统 计 信 息 来 检测 统计 关联 ， 并 更 加 准确 地 估算 多 
个 等 式 谓词 对 于 应 用 了 至 少 两 个 本 地 IN、OR 和 等 式 谓词 的 SQL 语句 的 组 合 过 滤 效 果 ， 以 
及 它们 对 于 应 用 了 某 种 等 级 的 OR 谓词 的 SQL 语句 的 过 滤 效 果 。 利 用 DB2 列 组 统计 信息 ， 
优化 器 可 以 在 多 个 谓词 相关 联 时 确定 更 好 的 得 询 访 问 计 划 ， 并 提高 查询 性 能 。 
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1. 多 个 本 地 等 式 和 本 地 IN 谓词 的 统计 关联 
如 果 SQL 语句 的 WHERE 子 句 使 用 了 多 个 请 词 ， 如 下 所 示 : 
Cl=2 ANIC2 IN (7 2 .39 


并 且 收 集 了 (Cl1，C2) 的 多 列 统 计 信 息 的 话 ， 那 么 优化 器 束 会 试看 检测 这 些 谓 词 间 的 统计 关 
联 以 提 闹 基数 估计 值 。 如 下 请 词 除 外 : 

e 市 有 JIN 或 OR 操作 符 的 连接 谓词 

e 带 有 不 等 式 、LIKE 或 IS NULL 操作 符 的 本 地 谓词 

e 市 有 了 于 得 询 的 谓词 

C1=? 谓词 束 是 本 地 等 式 博 词 ， 本 地 等 式 谓 词 是 应 用 于 单个 表 的 等 式 博 词 ， 描 述 如 下 : 


COEUMN = literal 


其 中 ，liternal 可 以 是 以 下 任 一 内 容 : 

e 他 量 值 

e 人 参数 标记 或 主 变量 

e 专用 寄存 器 (例如 CURRENT DATE) 

C2 IN(?,.?.?) 谓 词 则 是 本 地 IN 谓词 , 本 地 IN 谓词 是 应 用 于 同一 表格 一 一 与 本 地 谓词 
的 等 式 谓 词 ， 摘 述 如 下 : 


COLUMN IN ( <VALUE LIST> ) 


其 中 ，<VALUE LIST> 是 以 逗号 隔 开 的 一 个 或 多 个 上 述 (在 本 地 等 式 谓 词 中 )liternal 的 列表 。 
相当 于 IN 谓词 的 OR 谓词 可 以 代 巷 IN 谓 词 在 SQL 语句 中 指定 , 而 且 优 化 右 将 会 在 说 
明 统 计 关 联 时 按 相 同 的 方式 加 以 处 理 ， 也 就 是 下 向 的 谓词 写法 : 


ODN 
相当 于 : 
和 6 IteralooBR or Ecrol 0 oR Lloroaln 


下 面 的 例子 说 明了 优化 费 如 何 检测 本 地 I 和、OR 和 等 式 谓词 间 的 天 联 : 


a) COL 1 IN ( <VALUE LIST> ) AND COL 2=literal AND COL 3=literal 


by (COE FE=iiteral 1 OR COL 1=illtaral 2 OR 二 OR COE I— 1iternal ny ANMLD 
CoO 2—11iteral AND ... BHD CO mLiteral 
Cj) COL 1 IN ( <VALUE LIST> } AND COL 2 IN ( <VALUE LIST»> } AND ... AND COL m 


IN ( <VALUE LIST> ) 
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[EC eraT GOREOIR literal 2 DND TEOE 2=17teral 1 OFTOE Zel1iEeral 3) 


AND ... BND (COL mTiteral: 1 OR COL Mliteral 27 
e) COL 1 IN ( <VALUE LIST> ) AND ... And COL m IN ( <VALUE LIST> ) AND 
Com 0 2 Eee nD 7 DN COLT Iieral 


EY COB l=]ateral 1 OR COL lI=literal 2) ANMD CO 2—1iteral AND CO 3=1l1teral 
IJ) (COL 1=literal 1 OR COL 1=literal 2) AND (COL 2=]11teral 1 OR COL 2=literal 2) 
SM eeral 


下 面 这 上 蔡 谓 词 是 优化 需 人 不 会 考 碟 为 其 检测 统计 关联 的 谓词 的 例子 : 


二 
RDUEOHS Titeratl) 
by LICOE l=Literal AND COL 2=11iteral} OR {COL l=literal AND CO 2=—1Titeral}y}) AND 
COL 3=literal 
Cn COL 1 IN ( <VALUE LIST> ) OR (COL 2 IN ( <VALUE LIST> ) ) AND EOD | eol 


2. 列 组 统计 信息 更 新 示例 
下 面 举 几 个 列 组 统计 信息 更 新 示例 。 


C1IN ( <VALUE LIST> ) AND C2 =liternal 
考虑 对 SAMPLE 数据 库 的 EMPLOYEE 表 执 行 如 下 查询 : 


SELECT EFIRSTNME, LASTNAME, JOB, WORKDEPT, SALARY FROM EMPLOYEE 
WHERE JOB IN (CLERK, "SALESREP") AND WORKDEPT = "A00' ORDER BY JOB, 
SALARY 


该 查询 从 EMPLOYEE 表 返 回 4 条 记录 ， 输 出 结果 如 下 所 示 : 


FIRSTNME LASTNAME JOB WORKDEPT SALARY 

GREG ORLANDO CLERK A00 39250..00 
SEAN DO CONNELL CLERK A00 49220.00 
DIAN HEMMINGER SALESREP AO00 46200.00 
VINCENAO LUCCHESSI SALESREP AU00 606200.00 


4 record(s) selected. 

SAMPLE 数据 库 在 创建 最 初 ， 还 没有 在 表 上 收集 统计 信息 。 为 了 保证 执行 计划 的 准确 
性 ， 需要 更 新 表 EMPLOYEE 的 统计 信息 。 下面 的 RUNSTATS 命令 在 EMPLOYEE 表 的 每 
个 列 上 收集 了 统计 信息 ， 包 括 分 布 统计 信息 和 所 有 在 EMPLOYEE 表 中 定义 的 索引 上 的 详 
细 统 计 信 息 (如 果 存 在 的 话 )。 该 命令 如 下 : 


RUNSTATS ON TABLE DB2INST] .EMPLOYEE WITH DISTRIBUTION AND DETAILED INDEXES ALL 
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下 面 使 用 dynexpln 来 租 看 该 SQL 语句 的 执行 计划 ， 执 行 计划 如 下 所 示 : 


sdynexpln -d sample -G "SELECT FIRSTNME, LASTNAME, JOB，WORKDEPT ， 
FROM EMPLOYEE WHEAND WORKDEPT = "AO0O0O'" 
Estimated Cost = 7.669430 


SALARY 
ORDER BY JOB, SALARY™ —t 


Estimated Cardinality = 1.1904"76 
Access Table Name = ORACLE.EMP] ID = 3,12 
| 并 Columns = 4 


Avoid Locking Committed Data 


| Evaluate Block/Data Predicates Before Locking Committed Row 
| Relation Scan 


在 上 述 访 问 计 划 输 出 中 ,估计 基数 为 1.190476， 基数 估 计 值 1.190476 与 实际 返回 的 4 
行 结果 不 符 。 这 是 因为 优化 器 假定 两 个 谓词 是 独立 的 ， 因 为 相关 的 索引 或 列 组 统计 信息 不 
存在 。 我 们 可 以 使 用 RUNSTATS 命令 在 (JOB,WORKDEPT) 上 收集 列 组 统计 信息 ， 以 此 为 
优化 器 提供 适当 的 信息 来 检测 两 个 列 之 则 的 统计 关联 (如 果 存 在 的 话 )， 命 令 如 下 : 


RUNSTATS ON TABLE DB2INST]1 .EMPLOYEE ON ALL COLUMNS AND COLUMNS 
( (JOB, WORKDEPT})}) WITH DISTRIBUTION AND DETAILED INDEXES ALL 


重复 上 面 的 步骤 ， 再 次 解释 查询 ， 然 后 生成 查询 访问 计划 ， 优 化 器 就 会 计算 出 更 好 的 
基数 估计 值 ， 因 为 它 在 两 个 列 上 收集 了 列 组 统计 信息 。 具 有 更 好 的 基数 估计 值 的 查询 访问 
计划 输出 如 下 所 示 : 


sdynexpln -Q sample -9 "SELECT FIRSTNME, LASTNAME, JOB, WORKDEPT, SALARY 
FROM EMPLOYEE WHERE JOB IN ("CLERK", "SALESREP") AND 
ORDER BY JOB, SALARY” 一 七 
Estimated Cost = 118.487167 
Estimated Cardinality = 53.000000 


WORKDEPT = AUD 


Access Table Name = ORACLE.EMPLOYEE ID = 2,6 
| #Columns = 4 

| Volatile Cardinality 

| Avolid Locking Committed Data 


Evaluate Block/Data Predicates Before Locking Committed Row 
Relation Scan 


计 值 5 比 实际 值 4 高 了 一 些 。 可 能 已 经 注意 到 了 , 访问 计划 本 身 的 评估 成 本 (ESTIMATED 
COS 了 并 未 随 独 基数 估计 值 的 增 大 而 显著 改变 。 这 是 因为 本 例 中 摘 述 的 例子 都 很 简单 ， 数 
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据 量 非 营 小 (只 有 42 条 记录 )。 如 且 语 句 涉及 更 大 的 表 和 两 个 或 更 多 个 胡 的 连接 的 话 ， 答 询 
访问 计划 的 评 佑 成 本 束 很 可 能 会 因为 基数 佑 计 值 的 提高 而 显著 改变 。 


C1 IN (<VALUE LIST> ) AND C2 IN ( <VALUE LIST> ) 
这 个 示例 解释 说 明了 在 两 个 IN 谓词 上 的 列 组 统计 信息 的 效果 。 考 碟 以 下 检索 某 一 部 
门 的 经 理 和 设计 人 员 的 奖金 和 新 水 的 得 询 。 该 SQL 但 询 如 下 所 示 : 


SELECT FIRSTNME, LASTNAME, WORKDEPT, JOB, BONUS, SALARY FROM EMPLOYEE 
WHERE WORKDEPT IN ("D11, "D21") AND JOB IN ( -MANAGER ， DESIGNER ) 
ORDER BY WORKDEPT, SALARY 


该 查询 从 EMPLOYEE 表 返 回 12 条 记录 ， 输 出 结果 如 下 所 示 : 


FIRSTNME, LASTNAME, WORKDEPT JOB BONUS SALARY 

MASATOSHI YOSHIMURA Bi DESITGNER 300.09 44680 .00 
JENNIEFER LUTA Dil DESITGNER 600.00 49840 .00 
JAMES WALKER D11 DESITGNER 400.00 J0450.00 
MARILLYN SCOUTTEN Bd DESITGNER 300.00 31340.00 
BRUCE ADAMSON B11 DESIGNER oa00.00 oD 00 
DAVTD BROWN D11 DESITGNER 600.00 1140.00 
ELI2ABETH PIANKA D411 DESIGNER 400 .00 bzZ250 .00 
KIYOSHI YAMAMOTO Bi DESITGNER 200.00 64680.00 
WILLIAM JONES D11 DESITGNER 400.00 68z210.00 
REBA JOHN p11 DESITGNER 600.00 9840 .00 
TIRVINC STERN B11 MANAGER 可 局 站 。 自 蝇 22 -00 
EVA PULASKI D21 MANAGER 100 .00 96170 .00 


12? record(s)} selected. 


首先 , 在 没有 获得 (JOB,WORKDEPT) 列 组 统计 信息 的 情况 下 检查 访问 查询 计划 和 其 数 
估计 值 ,可 以 按 如 下 方式 在 EMPLOYEE 表 上 执行 另外 一 个 RUNSTATS 命令 来 完成 该 检查 : 


RUNSTATS ON TABLE DB2INSTI1 .EMPLOYEE WITH DISTRIBUTION AND DETAILED INDEXES ALL 


由 于 前 面 收集 的 统计 信息 被 最 新 的 RUNSTATS 命令 清除 了 ， 因 此 先前 收集 的 列 组 统 
计 信 息 不 复 存 在 。 再 次 运行 DYNEXPLN 来 查看 该 SQL 语句 的 执行 计划 ， 以 此 来 检查 优化 
器 估计 的 基数 。 查 询 访 问 计 划 如 下 所 示 : 


sdynexpln -d sample -q "SELECT FIRSTNME, LASTNAME, WORKDEPT, JOB, BONUS, 
SALARY FROM EMPLOYEE WHERE WORKDEPT IN (‘DI1Il., D21")} AND 
JOB IN (MANAGER "DESIGNER") ORDER BY WORKDEPT, SALARY ” -tt 

Estimated Cost = 7.668932 
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Estimated Cardinality = 7.285715 

Access Table Name = ORACLE.EMP] ID = 3,12 

| #Columns = 6 

| Avoid Locking Committed Data 

| Evaluate Block/Data Predicates Before Locking Committed Row 
| Relation Scan 

| | Prefetch: Eligible 

| Lock Intents 

| | Table: Intent Share 


基数 估计 值 7.285715 与 实际 返回 的 12 行 结果 不 符 。 在 (JOB,.WORKDEPT) 上 收集 列 组 
统计 信息 会 在 计算 两 个 IN 谓词 的 组 合 过 滤 效 果 时 为 优化 器 提供 必要 的 信息 ， 用 以 说 明 统 
计 关 联 。RUNSTATS 命令 如 下 : 


RUNSTATS ON TABLE DB2INST] .EMPLOYEE ON ALL COLUMNS AND COLUMNS 
( (JOB, WORKDEPT)) WITH DISTRIBUTION AND DETAITLLED INDEXES ALL 


重复 上 面 的 步骤 ， 再 次 解释 查询 ， 生 成 查询 访问 计划 之 后 ， 优 化 器 会 计算 出 更 好 的 、 
与 实际 结果 很 接近 的 基数 估计 值 11.200000。 具 有 更 精确 的 基数 估计 值 的 查询 访问 计划 如 下 
所 示 : 


$dynexpln -d sample -q "SELECT FIRSTNME, LASTNAME, WORKDEPT, JOB, BONUS, 
SALARY FROM EMPLOYEE WHERE WORKDEPT IN ( DLL D21")} AND 
JOB IN ( MANAGER ， DESIGNER  ) ORDER BY WORKDEPT, SALARY ™” -tt 

Estimated Cost = 117.296455 

Estimated Cardinality = 11.200000 

Access Table Name = ORACLE.EMPLOYEE ID = 2,6 

| #Columns = 6 

| Volatile Cardinality 

| Avoid Locking Committed Data 


C1 IN (<VALUE LIST> ) AND C2 IN ( <VALUE LIST> ) AND C3=literal 
在 这 个 例子 中 ,将 向 刚才 那个 便 询 中 添加 第 3 个 谓词 ,确定 有 哪些 职工 得 到 了 500 美 
元 的 奖金 。 该 SQL 查询 如 下 所 示 : 


SELECT FIRSTNME,, LASTNAME, WORKDEPT, JOB， BONUS., 
WHERE WORKDEPT IN ("D11’, D21") AND 
BONUS = 500 ORDER BY WORKDEPT, SALARY 


SALARY FROM EMPLOYEE 
JOB IN ( -MANAGER ， DESIGNER ) AND 


该 查询 从 EMPLOYEE 表 返 回 $ 条 记录 ， 输 出 结果 如 下 所 示 : 
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FIRSTNME LASTNAME WORKDEPT JOB BONUS SALARY 

MASATOSHI YOSHIMURA D1l DESIGNER J00.00 44680 .00 
MARILLYN SCOUTTEN D1l1 DESIGNER J00.00 D31340.00 
BRUCE ADAMSON DLL DESIGNER J00.00 2392280.00 
KI1IYOSHI YAMAMOTO D11 DESIGNER J00.00 64680.00 
TIRVING STERN D1l1 MANAGER J00.00 12250.00 


D record(s) selected. 
使 用 下 面 的 RUNSTATS 命令 更 新 统计 信息 : 


RUNSTATS ON TABLE DB2INSTL .EMPLOYEE 
WITH DISTRIBUTION AND DETAILED INDEXES ALL 


在 没有 列 组 统计 信息 的 情况 下 再 次 收集 统计 信息 ， 优 化 幽会 选择 类 似 如 下 所 示 的 会 询 


访问 计划 ， 它 的 基数 估计 值 为 2.428572。 该 查询 访问 计划 如 下 所 示 : 


sdynexpln -dd sample -G "SELECT FIRSTNME, LASTNAME, WORKDEPT, JOB, BONUS, 
SALARY FROM EMPLOYEE WHERE WORKDEPT IN ("D1Il1', D21°) AND JOB IN 
( “MANAGER ， DESIGNER ) AND BONUS = 00 ORDER BY WORKDEPT, SALARY™ -tt 


Estimated Cost = 7.683424 

Estimated Cardinality = 2.428572 

Access Table Name = ORACLE.EMP]1] ID = 3,12 
|” 寺 CG umns 二 去 

| Avoid Locking Committed Data 

| Evaluate Block/Data Predicates Before Locking Committed Row 
| Relation ‘Scan 

| | Prefetch: Eligible 

ek JINEanEs 1 


在 WHERE 子 句 中 应 用 了 3 个 谓词 ， 如 果 假 设 它们 是 独立 的 话 ， 会 导 任 优化 右 低 估 基 
数 。 为 了 解释 说 明 优化 上 融 如何 使 用 索引 统计 信息 以 及 列 组 统计 信息 来 检测 统计 天 联 ， 创 建 
3 个 列 JOB、WORKDEPT、BONUS) 的 索引 并 收集 统计 信息 。 使 用 下 


CREATE INDEX JOB DEPT BONUS ON EMPLOYEE (JOB,WORKDEPT,BONUS) 


=-— The RUNSTATS command provides the option to collect statistics on a set of 


-— indexes only, without affecting the statistics Previously collected. 


RUNSTATS ON TABLE DB2INSIJ .EMPLOYEE FOR DETATLED INDEXES DB2INSTL .JOB DEPT BONUS 


以 及 在 其 上 收集 的 统计 信息 来 更 正 碍 询 访问 计划 的 
基数 估计 值 。 从 得 询 访 问 计 划 中 更 正 了 的 基数 估计 值 的 输出 如 下 上 所 示 : 


然后 优化 锅 会 使 用 新 创建 的 索 
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Estimated Cost = 7.668263 

Estimated Cardinality = 5.250000 - 注 : 这 个 值 和 实际 返回 的 5 行 相近 
Table Constructor 

| 2-Row (Ss) 

Nested Loop Join 

| Access Table Name = ORACLE .EMP1 ID = 3,12 

| Index Scan: Name = ORACLE.JOB DEPT BONUS ID = 1 
| Regular Index (Not Clustered) 

| Index Columns: 

| 1 1: JoB (Ascending) 

| | 2: WORKDEPT (Ascending) 

| 1 3: BONUS (Ascending) 


| 
| 
| 
| 
| 
| 
| Caolamns — 5 OC 四 和 


C1=LITERAL1 OR C1=LITERAL2) AND (C2=LITERAL1 OR C2=LITERAL) AND 
C3=LITERAL 
这 个 例子 使 用 与 前 面 等 效 的 OR 谓词 来 代 蔡 IN 谓词 。 该 SQL 查询 如 下 : 


SELECT FIRSTNME, LASTNAME, WORKDEPT, JOB, BONUS, SALARY EF ROM EMPLOYEE 
WHERE (WORKDEPT = DLL OR WORKDEPT = "D21°"') AND (JOB = "MANAGER"' OR 
JOB = "DESIGNER") AND BONUS = 300 ORDER BY WORKDEPT, SALARY 


该 查询 返回 的 结果 与 前 面 示例 返回 的 结果 相同 。 这 个 示例 解释 说 明了 部 分 统计 信息 对 
于 优化 器 估计 基 数 的 能 力 的 影响 。 执 行 下 面 的 命令 删除 刚才 创建 的 索引 ， 并 只 使 用 组 
((JOB,WORKDEPT)) 上 的 列 组 统计 信息 再 次 收集 统计 信息 : 


DROP INDEX JOB DEPT BONUS 
RUNSTATS ON TABLE DB2INST] .EMPLOYEE ON ALL COLUMNS AND COLUMNS 
( (JOB, WORKDEPT)) WITH DISTRIBUTION AND DETALTLED INDEXAES ALL 


使 用 在 合适 的 IN、OR 和 等 式 谓词 所 引用 的 列 的 子 集 上 收集 的 列 组 统计 信息 ， 优 化 费 
估计 出 了 更 接近 于 上 其 实 结果 的 基数 ， 但 如 果 列 组 统计 信息 是 在 全 部 3 个 列 上 收集 的 话 ， 访 
估计 值 的 粮 确 度 要 低 于 前 一 示例 中 的 人 从。 该 全 询 访 问 计 划 输 出 如 下 所 示 : 


Estimated Cost = 7.683424 

Estimated Cardinality = 2.428572 

Access Table Name = ORACLE.EMP]1] ID = 3,12 

| #Columns = 5 

| Avoid Locking Committed Data 

| Evaluate Block/Data Predicates Before Locking Committed Row 
| Relation Scan 
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| | Prefetch: Eligible 
| Lock Intents 


优化 器 使 用 了 在 组 (JOB,WORKDEPT) 上 收集 的 列 组 统计 信息 来 说 明 两 个 OR 谓词 间 的 
统计 关联 ， 但 不 包括 列 组 中 的 BONUS， 它 认为 BONUS=500 谓词 独立 于 那 两 个 OR 谓词 ， 
结果 导致 稍稍 低估 了 最 终 的 基数 。 

如 果 使 用 可 视 化 解释 或 db2exfmt 输出 的 “Optimized Statement ”部 分 , 会 注意 到 该 SQL 
语句 的 OR 谓词 被 转换 成 了 与 它们 等 效 的 IN 谓词 。db2exfmt 的 输出 如 下 所 示 : 


Optimized Statement : 


SELECT QD.FIRSTINME AS “上 IRSINME ， 只 .LASTNAMP AS “LASINAME”， 吕 D .WORKDEETI AS 
"WORKDEPT™, Qo.JOB AS JUOB”， T0000500.00 AS "BONUS”, OI.3ALARY AS 
"SALARY "FROM DBZ2INST]L .EMPLOYEE AS QD 

WHERE (Q3.BONUS = +0000500.00) AND .JOB IN (MANAGER “, DESIGNER ) AND 
QD-WOREDEPT IN ( DLL ， D21 ) ORDER BY OQ .WORKDEPT, 0V.SALARY 


在 全 部 3 列 上 收集 列 组 统计 信息 会 导致 与 前 一 示例 相同 的 基数 估计 值 。 在 这 种 情况 下 ， 
仍然 在 前 面 的 两 列 JOB,WORKDEPT) 上 收集 列 组 统计 信息 ， 并 包括 整个 3 列 
(JOB,WORKDEPT,BONUS)。RUNSTATS 命令 如 下 所 示 : 

RUNSTATS ON TABLE DB2INST] .EMPLOYEE ON ALL COLUMNS AND COLUMNS 


( (JOB, WORKDEPT), (JOB,WORKDEPT, BONUS)) WITH DISTRIBUTION AND DETALLED 
INDEXES ALL 


可 以 在 相同 的 列 集合 间 收 集 到 一 个 或 更 多 的 列 组 统计 信息 。 收 集 这 些 统计 信息 后 生成 
的 查询 访问 计划 与 前 一 示例 中 最 后 的 计划 相同 。 至 于 这 种 情况 的 验证 ， 就 留 给 读者 自己 进 
行 练习 。 

(C1=LITERAL1 AND C2=LITERAL2) OR (C1=LITERAL3 AND C2=LITERAL4) 

这 个 例子 解释 说 明了 列 组 统计 信息 对 合格 的 OR 谓词 的 影响 。 考 虑 在 EMPLOYEE 表 
上 执行 如 下 查询 。SQL 语句 如 下 所 示 : 

SELECT FIRSTNME, LASTNAME, WOREDEPT, JOB, BONUS, SALARY FROM EMPLOYEE 


WHERE ( WORKDEPT= "E21" AND JOB="FIELDREP" } OR {( WORKDEPT="D21" AND 
JOB="MANAGER”" ) ORDER BY WORKDEPT, SALARY 


该 查询 从 EMPLOYEE 表 返 回 6 条 记录 ， 输 出 结果 如 下 所 示 : 


F IRSTNME, LASTNAME, WORKDEPT JOB BONUS SALARY 
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EVA PULASKI D21 MANAGER 100.00 96170 .00 
ROY ALONZO E21 FIELDREP J00.00 31840 .00 
HELENA WONG E21 FIELDREP J00.00 和 
RAMLAL MEHTA E21 FIELDREP 400.00 39950.00 
JASON GOUNOT E21 FIELDREP J00.00 43840 .00 
WING LEE E21 FIELDREP 200.00 45370 .00 


6 record(s) selected. 
执行 下 面 的 RUNSTATS 命令 : 
RUNSTATS ON TABLE DB2INST]1 .EMPLOYEE WITH DISTRIBUTION AND DETAILED INDEXES ALL 


在 没有 列 组 统计 信息 的 情况 下 再 次 收集 统计 信息 ， 优 化 融会 选择 关 似 如 下 所 示 的 但 询 
访问 计划 ， 它 的 基数 估计 值 为 1.880952。 优 化 器 选择 的 查询 访问 计划 如 下 所 示 : 


Estimated Cost = 7.718598 

Estimated Cardinality = 1.880952 

Access Table Name = ORACLE.EMPI1I ID = 3,12 

| #Columns = 6 

| Avolid Locking Committed Data 

“1 TabIe: TnEfent share IN 


在 列 (JOB,WORKDEPT) 上 收集 列 组 统计 信息 能 够 让 优化 器 更 好 地 估计 OR 谓词 的 过 滤 
效果 ,因为 OR 谓词 的 每 一 个 子 项 都 在 JOB 和 WORKDEPT 列 上 应 用 了 一 组 本 地 等 式 谓 词 。 
执行 下 面 的 RUNSTATS 命令 : 


RUNSTATS ON TABLE DB2INST] .EMPLOYEE ON ALL COLUMNS AND COLUMNS 
( (JOB, WORKDEPT)) WITH DISTRIBUTION AND DETAILED INDEXES ALL 


收集 了 列 组 统计 信息 之 后 ， 优 化 器 会 选择 类 似 如 下 所 示 的 查询 访问 计划 ， 它 的 基数 估 
计 值 提高 了 ， 与 实际 的 结果 6 行 很 接近 。 得 到 了 更 精确 的 基数 估计 值 的 查询 访问 计划 ， 如 
下 所 示 : 


Estimated Cost = 128.489594 

Estimated Cardinality = 5.600000 

Access Table Name = ORACLE.EMPLOYEE ID = 2,6 
| #Columns = 6 

| | Prefetch: Eligible 


上 面 讲解 了 一 些 列 组 统计 信息 更 新 的 示例 ， 其 实 ， 优 化 右 凭 们 精确 的 基数 估计 值 来 准 
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确 计 算出 每 个 待定 查询 访问 计划 的 成 本 。 可 以 利用 DB2 中 的 列 组 统计 信息 的 扩展 用 途 来 为 
优化 器 提供 更 多 的 信息 ， 从 而 使 优化 器 更 好 地 估计 基数 ， 选 择 最 佳 的 查询 访问 计划 。 列 组 
统计 信息 对 于 处 理 复杂 的 OLAP 查询 尤其 重要 。 


7.4 数据 坊 问 方式 


查询 优化 器 在 编译 一 条 SQL 语句 时 估计 满足 查询 的 不 同方 法 的 执行 成 本 。 根据 它 的 估 
计 ， 优 化 器 选择 优化 访问 方案 。 访 问 方案 指定 解析 一 条 SQL 语句 所 需 的 操作 顺序 。 当 绑 定 
一 个 应 用 程序 时 , 会 创建 一 个 程序 包 。 此 程序 包 包 含 该 应 用 程序 中 所 有 静态 SQL 语句 的 访 
问 方案 。 动 态 SQL 语句 的 访问 方案 在 执行 应 用 程序 时 创建 。 

有 三 种 方法 来 访问 表 中 的 数据 : 

e 顺序 扫描 整个 表 。 

e 通过 首先 访问 表 上 的 索引 来 定位 特定 表 的 行 ， 再 从 表 中 读 取 相应 行 。 

e 通过 扫描 共享 。 

可 以 根据 谓词 中 定义 的 条 件 对 行进 行 过 滤 ( 这 些 谓词 通常 在 WHERE 子 句 中 指定 )。 所 
访问 的 表 中 被 选中 的 行 合并 在 一 起 生成 结果 集 ， 还 可 以 对 输出 的 结果 进行 分 组 或 排序 等 ， 
作 进一步 处 理 。 

从 DB2 9.7 开始 ， 默 认 的 数据 访问 方式 是 扫 摘 共享 。 即 ， 一 个 扫描 可 以 使 用 另 一 个 扫 
描 的 绥 神 池 页 。 扫 摘 共 享 能 够 提高 工作 负载 并 发 性 和 性 能 。 通 过 进行 扫 拉 共享， 系统 能 够 
支持 更 多 的 并 发 应 用 程序 ， 查 询 可 以 更 高 效 地 执行 ， 系 统 吞 吐 量 得 以 提升 ， 甚 至 连 未 参与 
扫描 共享 的 查询 也 能 从 中 受益 。 如 果 环 境 中 的 应 用 程序 对 大 型 表 执 行 表 扫 摘 或 多 维 集群 
(MDC) 块 索引 扫 摘 之 类 的 扫 摘 , 那么 扫描 共享 功能 的 效用 尤其 明显 。 编译 占 根 据 扫描 类 型 、 
扫描 目的 、 隔 离 级 别 以 及 对 每 条 记录 完成 的 工作 量 等 因素 来 确定 一 个 扫描 是 否 适 合 参 与 扫 
描 共 享 。 


7.4.1 全 表 扫 摘 


顺序 扫 拉 整个 表 叫 作 全 表 扫 摘 ( 或 者 关系 扫 朱 )。 顾 名 患 义 ， 全 表 扫 拍 指 的 是 在 做 得 询 
的 时 候 ， 为 了 得 到 满足 谓词 约束 的 结 末 需要 人 志 历 目标 表 的 所 有 内 容 。 显 然 这 种 数据 访问 方 


到 几 上 日 万 或 更 多 )， 优 化 需 经 过 评 佑 之 后 最 终 选 用 了 这 种 方式 进行 数据 访问 的 话 ， 市 来 的 性 
能 结 末 会 是 非常 关 的 。 但 是 对 于 一 些 记录 很 少 的 表 ， 这 种 数据 访问 方式 却 可 能 会 市 来 最 好 
的 性 能 表现 ， 比 如 目标 表 的 内 容 只 有 几 十 行 的 数据 ， 那 么 与 其 先 执 行 案 引 扫 接 再 去 表 中 访 
问 数 据 以 得 到 结果 ， 还 不 如 直接 进行 全 表 扫 插 的 效率 更 遇 、 性 能 更 好 。 
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所 以 在 遇 到 全 表 扫 描 的 时 候 并 不 能 简单 地 得 到 绝对 化 的 结论 。 这 需要 具体 情况 具体 分 
析 ， 下 面 的 一 些 关 于 全 表 扫 描 的 一 些 性 能 原则 可 以 帮助 我 们 更 好 地 分 析 全 表 扫 描 的 得 失 。 

首先 需要 如 免 对 较 大 的 表 进 行 全 表 扫 描 ， 但 是 在 满足 下 面 情况 的 时 候 可 以 考虑 使 用 全 
表 扫 描 : 

。 从 表 中 选择 几乎 所 有 的 行 

。 修改 表 中 的 所 有 行 

。 表 比 较 小 


7.4.2 索引 扫 接 


在 数据 库 管 理 需 因 下 列 任何 原因 访问 寺 引 时 ， 执 行 索引 扫 摘 : 
e 在 访问 基本 表 前 ， 缩 小 满足 条 件 行 的 集合 (通过 扫 摘 该 索引 特定 范围 内 的 行 )。 索 引 
扫描 范围 ( 扫 摘 的 起 点 和 终点 ) 由 比较 索引 列 的 得 询 中 的 值 确定 。 
e 排序 输出 。 
e 百 接 检索 请 求 的 列 数据 。 如 果 所 有 请 求 的 数据 位 于 该 索引 中 ， 那 么 不 再 要 访问 数 
据 表 。 这 称 为 完全 索引 访问 (index only access)。 
如 果 使 用 ALLOW REVERSE SCANS 选项 创建 索引 ，, 那么 也 可 以 按 与 索引 定义 的 方 回 
相反 的 方 回来 扫 朱 ， 也 束 是 双 辣 扫描 。 
如 条 未 创建 适当 的 索引 或 索引 扫描 的 成 本 更 局， 那么 优化 右 选 择 表 扫 朱 。 当 表 不 大 ， 
索引 集群 比率 低 或 租 询 请 求 大 多 数 表 行 时 ， 索 引 扫 描 的 成 本 可 能 更 局 。 要 和 伍 明 访问 方案 使 
用 表 扫 摘 还 是 索引 扫 拉 ， 使 用 解释 工具 (可 参考 本 书 “ 第 9 草 : SQL 语句 调 优 ”的 内 容 )。 


定 界 范 围 的 索引 扫描 

要 确定 索引 是 否 可 以 用 于 特定 查询 ， 优 化 器 从 索引 第 1 列 开 始 对 每 列 求 值 ， 以 了 解 它 
是 否 可 用 来 满足 等 式 和 WHERE 子 名 中 的 其 他 谓词 。 谓 词 是 WHERE 子 句 中 搜索 条 件 的 元 
素 ， 表 示 或 隐 含 比较 运算 。 在 下 列 情 况 下 ， 可 使 用 谓词 来 定 界 索引 扫描 范围 : 

e 测试 “为 空 ” 还 是 “不 为 空 ” 

e 测试 是 否 等 于 基本 子 查询 (是 不 包含 ANY、ALL 或 SOME 的 子 查询 )， 并 且 子 查询 

没有 相关 列 引 用 其 直接 父 查 询 块 (此 子 查 询 是 其 子 选择 的 SELECT)。 

e 测试 严格 和 相 容 不 等 卫 

以 下 示例 说 明 索 引 何 时 可 以 用 来 限制 某 个 范围 。 

考虑 具有 下 列 定 义 的 索引 : 


INDEX IX1l: NAMP FR 
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DEPT AKC， 
MGR DESC, 
SALARY DEsSC, 
YEARS ASC 


在 此 情况 下 ， 下 列 谓词 可 以 用 来 限制 索引 IX1 的 扫 插 范围 : 


WHERE NAME = :hvil 
AND DEPT = :hv2 


或 省 


WHERE, MGR = :hvl 
AND NAME = :hv2 
AND DEPT = :hv3 
注意 在 第 2 个 WHERE 子 句 中 ， 谓 词 不 必 按 键 列 在 索引 中 出 现 的 相同 顺序 来 指定 。 尽 
党 示例 使 用 绑 定 ( 牡 主 ) 杰 量 , 但 其 他 变量 (例如 参数 标记 、 表 达 式 或 弟 数 ) 将 会 有 相同 的 效果 。 
考虑 使 用 ALLOW REVERSE SCANS 参数 创建 的 日 个 索引 。 这 类 索引 支持 以 创建 索引 
时 定义 的 方 同 扫 手 和 以 相反 的 方 同 扫 插 。 创建 语 句 可 能 类 似 于 如 下 所 示 : 


CREATE INDEX iname ON tname (cname DESC) ALLOW REVERSE SCANS 


在 这 种 情况 下 ， 根 据 CNAME 中 的 降序 值 来 构建 索引 (NAME)。 人 允许 反 同 扫 抽 后 ， 尺 
管 列 中 的 索引 被 定义 为 按 降 序 扫 摘 ， 但 也 可 以 按 升序 进行 扫描 。 实 际 是 否 以 两 个 方 回 使 用 
索引 不 是 由 用 户 控 制 的 ， 而 是 由 优化 亏 在 创建 和 考虑 访问 方案 时 控制 的 。 

在 如 下 WHERE 子 句 中 , 将 只 使 用 NAME 和 DEPT 谓词 来 定 界 索 引 扫 描 的 范围 , 而 不 
使 用 SALARY 或 YEARS 谓词 : 


WHERE NAME = :hvil 
AND DEPT = :hv2 AND SALARY = :hv4 
AND YEARS = :hvy 


这 是 因为 有 键 列 (MGR) 将 这 些 列 与 最 前 面 两 个 索引 键 列 NAME，DEPT) 分 开 ， 因 此 排 
序 将 关闭 。 但 是 ， 一 旦 该 范围 由 NAME = :hvl 和 DEPT = :hv2 谓词 确定 ， 那 么 可 根据 其 余 
索引 键 列 来 对 其 余 谓 词 求 值 。 


测试 不 等 式 的 索引 扫描 

革 些 不 等 式 谓 词 可 以 对 索引 扫描 的 范围 定 界 。 有 两 种 类 型 的 不 等 式 谓 词 : 
(1) 严格 不 等 式 谓词 

可 用 作 范 围 定 界 谓词 的 严格 不 等 式 运 算 符 是 大 于 (>) 和 小 于 (<)。 
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只 考虑 一 个 具有 严格 不 等 式 谓 词 的 列 用 于 定 界 索引 扫描 的 范围 。 在 下 面 这 个 示例 中 ， 
NAME 和 DEPT 列 上 的 谓词 可 用 于 定 界 该 范围 ， 但 不 能 使 用 MGR 列 上 的 谓词 。 
WHERE NAME = :hv 
AND DEPT > “hve2 


AND DEPT < :hv3 
AND MGR < :hv4 


(2) 相 容 不 等 式 谓词 

以 下 是 可 用 作 范 围 定 界 谓词 的 相 容 不 等 式 运 算 人 符 : 

e > 一 和 <= 

e BETWEEN 

e LIKE 

要 定 界 索引 扫 拍 的 范围 ， 将 考 上 在 多 个 具有 相 容 个 等 式 谓词 的 列 。 在 以 下 示例 中 ， 所 有 
谓词 都 可 用 于 定 界 索引 扫描 的 范围 

WHERE NAME = :hvl 

AND BEPT >=— :hv2 


AND DEPT <= :hv3 
AND MGR <= :hv4 


要 进一步 说 明 此 示例 ， 假 定 “:hv2 =404.:hv3 = 406 和 :hv4 = 1234$”。 数据 库 管 理 器 将 
使 用 该 索引 扫 拉 部门 404 和 405 的 全 部 , 但 当 扫 摘 到 职员 号 (MGR 列 ) 大 于 12345 的 第 1 个 
经 理 时 ， 将 停止 扫描 部 门 406。 


排序 数据 索引 扫描 

如 果 奏 询 要 求 按 排序 顺序 输出 ， 并 且 如 果 排 序列 从 第 1 个 索引 键 列 开始 连续 出 现在 访 
索引 中 ,那么 可 使 用 索引 来 对 数据 排序 。 确 定 顺 序 或 排序 可 由 类 似 如 下 的 操作 产后 :ORDER 
BF DISTINGT, GROUP BY "— NE” 于 碍 同 SEE” 于 得 大 ”< ”于 在 同 : 
INTERSECT、EXCEPT 或 UNION。 一 个 例外 是 当 比 较 索 引 键 列 是 否 等 于 “常数 值 ” 时 ， 
该 各 数值 是 值 为 钊 数 的 任何 表达 式 。 在 这 种 情况 下 ， 排 序列 不 能 是 第 1 个 索引 键 列 。 

请 考虑 以 下 查询 : 


WHERE NAME = "JONES'" AND DEPT = “D93" ORDER BY MGR 


对 于 此 得 询 ， 可 使 用 索引 来 对 行 排 序 ， 因 为 NAME 和 DEPT 将 始终 是 相同 的 值 ， 所 以 
将 被 排序 。 也 就 是 说 ， 前 导 WHERE 和 ORDER BY 子 句 等 效 于 : 


WHERE NAME = “ JONES AND DEPT = "D93" ORDER BY NAME, DEPT, MGR 
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也 可 使 用 唯一 索引 来 降低 排序 顺序 寄 求 。 考 虑 下 列 索 引 定义 和 ORDER BY 子 人 |]: 


UNIQUE INDEX IX0: PROJNO ASC 
SELECT PROJNO, PROJNAME, DEPTNO FROM PROJECT 
ORDER BY PROJNO, PROJNAME 


不 需要 根据 PROJNAME 列 再 进行 排序 ， 因 为 IX0 索引 确保 PROJNO 是 唯一 的 。 此 唯 
一 性 确保 对 于 每 个 PROJNO 值 只 有 一 个 PROJNAME 值 。 

本 节 说 明了 SQL 编译 器 提供 的 两 种 数据 访问 方法 : 全 表 扫 描 和 索引 扫描 。 这 两 种 方法 
在 数据 库 进行 实际 的 数据 访问 时 通常 都 可 能 出 现 ， 在 一 般 情 况 下 进行 较 大 规模 数据 访问 的 
时 候 ， 索 引 扫 描 通 常 是 首选 方法 ， 因 为 它 能 够 提供 更 好 的 性 能 。 在 合理 索引 的 配合 下 ， 案 
引 扫 描 的 性 能 一 般 都 会 高 于 甚至 是 远 远 高 于 全 表 扫 描 。 

在 使 用 索引 扫描 的 时 候 ， 在 目标 表 上 创建 合理 的 索引 就 显得 十 分 重要 ， 在 访问 同样 数 
据 的 情况 下 ， 合 理 的 索引 与 不 合理 的 索引 在 性 能 上 的 差别 可 以 达到 几 十 倍 、 几 百倍 甚至 更 
多 。 所 以 一 定 要 创建 合理 的 索引 才能 发 挥 出 索引 扫 摘 的 优势 ， 如 何 构建 出 合理 的 索引 请 参 
考 本 书 “ 第 8 章 : 索引 设计 和 优化 ” 


7.4.3 ”扫描 共 圣 


扫描 共享 是 指 一 个 扫描 利用 另 一 扫描 所 完成 工作 的 能 力 。 共 享 的 工作 范围 可 以 包括 磁 
盘 页 读 、 磁 盘查 找 、 缓 冲 池内 容 复 用 以 及 解压 等。 

工作 量 繁重 的 扫描 ， 例 如 对 大 型 表 进 行 的 表 扫 描 或 多 维 集群 (MDC) 块 索引 扫描 ， 有 时 
适合 与 其 他 扫描 共享 页 读 。 这 样 的 共享 扫描 可 以 从 表 中 的 任意 一 点 开始 ， 以 便利 用 已 包含 
在 缓冲 池 中 的 页 。 当 共享 扫描 到 达 表 的 末尾 时 ， 它 将 从 开头 继续 并 在 到 达 开始 点 时 完成 
操作 。 

默认 情况 下 , 扫描 共享 功能 处 于 启用 状态 , 是 否 适合 参与 扫描 共享 由 编译 器 自动 确定 。 
在 运行 时 ， 符 合 条 件 的 扫描 可 能 参与 ， 也 可 能 不 参与 扫描 共享 ， 这 取决 于 编译 时 某 些 内 部 
的 因素 。 

共享 的 扫描 操作 通过 “共享 组 ”进行 管理 。 每 个 共享 组 尽 可 能 将 它们 的 成 员 置 于 一 起 ， 
以 便 最 大 程度 地 增加 共享 的 好 处 。 如 果 共 享 组 里 一 个 扫描 比 另 一 个 扫描 快 ， 那 么 页 共享 的 
好 处 可 能 会 减弱 或 消失 。 在 这 种 情况 下 ， 缓 冲 池 中 由 第 一 个 扫描 访问 的 缓冲 池 页 在 共享 组 
中 的 另 一 个 扫描 能 够 访问 它们 之 前 可 能 会 被 清除 。 数 据 服 务 器 按 同 一 个 共享 组 中 两 个 扫描 
之 间 的 缓冲 池 页 数 测量 它们 之 间 的 距离 ， 数 据 服务 器 还 监视 扫描 速度 。 如 果 同 一 个 共享 组 
中 两 个 扫描 之 间 的 距离 增 大 到 太 大 , 那么 它们 可 能 无 法 共享 缓冲 池 页 。 为 了 减少 这 种 情况 ， 
可 以 对 较 快 的 扫描 进行 调 速 ， 以 允许 较 慢 的 扫描 在 数据 页 被 清除 前 访问 那些 页 。“ 共 享 集 ” 
通过 同一 种 访问 机 制 (例如 表 扫 描 或 块 索引 扫描 ) 访 问 同一 个 对 象 (例如 一 个 表 ) 的 共享 组 的 
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集合 。 对 于 表 扫描 而 言 ， 页 读 顺 序 按 页 标识 递增 ， 对 于 块 索 引 扫描 而 言 ， 页 读 顺 序 按键 什 
递增 。 

高 优先 级 扫描 操作 从 来 不 会 被 低 优先 级 扫描 降低 扫描 速度 ， 而 是 移 至 另 一 个 共享 组 。 
高 优先 级 扫描 可 能 会 被 放 入 某 个 组 并 由 于 该 组 中 低 优先 级 扫描 者 所 完成 的 工作 而 受益 。 只 
要 受益 持续 ， 它 将 一 直 停留 在 该 组 中 。 通 过 对 快速 扫描 进行 调 速 或 者 将 其 移 至 更 快 的 共享 
组 (如 果 该 扫描 遇 到 这 样 的 组 )， 数 据 服 务 器 不 断 调整 共享 组 以 确保 共享 保持 最 优 。 

可 以 使 用 db2pd 命令 的 -scansharing 参数 来 查看 关于 扫描 共享 的 信息 。 例 如 ， 对 于 单 
个 共享 扫描 ,db2pd 输出 将 显示 扫描 速度 和 扫描 调节 时 间 量 之 类 的 数据 .对 于 共享 组 , db2pd 
输出 将 显示 组 中 的 扫描 数 以 及 该 组 共享 的 页 数 。 


7.5 连接 方法 


连接 是 根据 信息 的 茶 些 公共 域 从 两 个 或 多 个 表 中 组 合 信息 的 过 程 。 当 对 应 行 中 的 信息 
符合 连接 条 件 时 ， 一 个 表 中 的 行 就 会 与 另 一 个 表 中 的 行 配对 。 

在 连接 两 个 表 时 ,无论 使 用 哪 种 连接 方法 ,总 有 一 个 表 被 选 为 外 部 表 (OUTER TABLE)， 
而 另 一 个 表 被 选 为 内 部 表 (INNER TABLE)。 优化 器 根据 所 选 连接 方法 的 成 本 和 类 型 决定 哪 
个 是 外 部 表 ， 哪 个 是 内 部 表 。 首 先 访 问 外 部 表 ， 并 且 只 扫描 一 次 。 根 据 连接 的 类 型 和 存在 
的 索引 ， 可 以 单 次 或 多 次 扫描 内 部 表 。 还 有 一 点 也 很 重要 ， 即 使 试图 连接 两 个 以 上 的 表 ， 
优化 需 每 次 也 只 连接 两 个 表 ， 并 在 必要 时 保存 中 间 结 果 。 


Table1 Table2 
PROJ PROJ ID PROJ_ID 名 称 
] ] Sam 
B 2 3 Joe 
CL 3 4 Mary 
D 4 ] SUue 
2 Mike 


要 将 标识 列 具 有 相同 值 的 TABLE1 和 TABLE2 连接 ， 使 用 下 列 SQL 语句; 


SEbLECT PROJ,. XX-PROJ 了 有 NANE， FROM ITABTLE1L x, TABLE2 YY 
WHERE 和 -上 ROJ TD = Y-.PROJ 1D 
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此 会 询 得 到 下 而 一 组 结 末 行 : 


PROJ PROJ ID 名 称 
和 A 1 Sam 
A 1 SUe 
B 2 Mike 
( 3 Joe 
D 4 Mary 


根据 连接 谓词 是 否 存 在 ， 以 及 涉及 的 由 表 和 索引 统计 信息 来 确定 的 各 种 成 本 ， 优 化 器 
选择 下 列 一 种 连接 方法 : 

e 眉 套 循环 连接 

e 合并 连接 

e 哈 希 连接 

可 以 提供 显 式 连接 运算 符 ( 如 INNER 或 LEFT OUTER JOIN) 来 确定 如 何在 连接 中 使 
用 表 。 但 是 ， 以 这 种 方式 改变 查询 之 前 ， 应 允许 优化 器 确定 如 何 连 接 表 ， 然 后 分 析 查询 性 
能 来 决定 是 否 要 添加 连接 运算 符 。 


7.5.1 其 套 循 环 连接 


在 侍 套 循环 连接 中 ， 外 部 表 只 被 扫描 一 次 。 对 于 内 套 循环 连接 ， 要 在 内 部 表 中 找到 与 
外 部 表 中 每 一 行 相 匹配 的 行 ， 有 两 种 方法 : 

(1) 扫描 内 部 表 。 谍 取 内 部 表 中 的 每 一 行 ， 并 且 针 对 访 行 决定 是 否 应 将 其 与 正在 考虑 
的 外 部 表 中 的 行 相连 接 。 

(2) 对 内 部 表 中 的 连接 列 进行 索引 查找 。 当 用 于 连接 的 谓词 所 包含 的 列 在 内 部 表 的 索 
引 中 时 ， 这 种 方法 是 可 行 的 。 这 极 大 地 减少 了 在 内 部 表 中 访问 的 行 数 。 

在 藤 套 循环 连接 中 ， 决 定 哪个 是 外 部 表 ， 哪 个 是 内 部 表 非 常 重 要 ， 因 为 外 部 表 只 扫描 
一 次 ， 而 针对 外 部 表 中 的 每 一 行 ， 都 要 访问 一 次 内 部 表 。 正 如 前 面 提 到 的 那样 ， 优 化 器 用 
成 本 模型 来 决定 谁 是 外 部 表 ， 谁 是 内 部 表 。 优 化 器 做 此 决定 时 会 考虑 几 个 因素 : 

e 上 表 的 大 小 
绥 冲 池 大 小 
谓词 
排序 要 求 
内 部 表 上 是 否 存 在 索引 
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退 父 循环 连接 是 用 下 面 两 种 方式 中 的 一 种 执行 的 : 
1) 对 于 外 部 表 中 每 个 被 访问 的 行 ， 扫 描 内 部 表 。 
例如 ， 表 Tl 和 T2 中 的 列 A 具有 下 列 值 : 


外 部 表 T1: 列 A 内 部 表 T2: 列 A 
2 3 
3 
3 2 
3 
1 


要 执行 能 套 循环 连接 ， 数 据 库 管 理 器 执行 下 列 步骤 : 

(1) 从 Tl 中 读 取 第 1 行 。A 的 值 是 “2”。 

(2) 扫描 T2， 直 到 发 现 一 个 匹配 项 (“2”)， 然 后 连接 这 两 行 。 
(3) 扫描 T2， 直 到 发 现下 一 个 匹配 项 (“2”)， 然 后 连接 这 两 行 。 
(4) 扫描 T2， 直 至 该 表 的 结尾 。 

(5) 返回 至 T1， 并 读 取 下 一 行 (“3”)。 

(6) 从 第 1 行 开始 ， 扫 描 T2， 直 到 发 现 匹 配 项 (“3”)， 然 后 连接 这 两 行 。 
(7) 扫描 T2， 直 到 发 现下 一 个 匹配 项 (“3”)， 然 后 连接 这 两 行 。 
(8) 扫描 T2， 直 至 该 表 的 结尾 。 

(9) 返回 至 T1， 并 读 取 下 一 行 (“3”)。 

(10) 像 以 前 一 样 扫描 T2， 连 接 匹 配 (“3”) 的 所 有 行 。 

2) 对 于 外 部 表 中 每 个 被 访问 的 行 ， 在 内 部 表 上 执行 索引 查找 。 
如 果 存 在 下 列 形式 的 谓词 ， 那 么 此 方法 可 用 于 指定 的 谓词 


expr (outer table.column} relop i1nner asic - COLlumn 


其 中 ，RELOP 是 比较 运算 符 (例如 =、>、>=、< 或 < 一 )， 而 EXPR 是 基于 外 部 表 的 有 效 表 
达 式 。 请 考虑 以 下 示例 : 


OUTER.Cl1 + OUTER.C2 <= INNER-CL OUTER.C4 < INNER.C3 


此 方法 可 以 显著 减少 在 每 次 访问 外 部 表 时 要 在 内 部 表 中 访问 的 行 数 ， 虽 然 这 取决 于 许 
多 因素 ， 包 括 连 接 谓词 的 选择 性 。 


奶 套 循环 连接 成 本 = 访问 第 1 个 表 的 成 本 (COST) + 从 第 1 个 表 中 访问 返回 的 行 数 X 访 
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问 第 2 个 表 的 成 本 


从 上 面 的 公式 中 可 以 看 到 ， 如 果 访 问 第 1 个 表 时 使 用 了 全 表 扫 描 ， 那 么 嵌 套 循环 连接 
的 成 本 无 疑 是 巨大 的 。 

当 对 和 嵌 套 循环 连接 求 值 时 ， 优 化 器 在 执行 连接 前 也 决定 是 否 对 外 部 表 排 序 。 如 果 根 据 
连接 列 对 外 部 表 排 序 ， 那 么 可 以 减少 从 磁盘 访问 内 部 表 的 页 的 读 操作 次 数 ， 因 为 很 可 能 这 
些 页 已 在 缓冲 池 中 。 如 果 连 接 使 用 高 度 集群 的 索引 来 访问 内 部 表 , 并 且 如 果 外 部 表 已 排序 ， 
那么 可 将 访问 的 索引 页 的 数目 减 至 最 小 。 


7.5.2 合并 连接 


合并 连接 需要 有 等 式 连接 谓词 (具有 TABLE1.COLUMN-TABLE2.COLUMN 格式 的 请 
词 )。 它 还 要 求 根据 连接 列 对 输入 表 进 行 排 序 。 这 称 为 等 式 连接 谓词 。 合 并 连接 需要 连接 列 
的 已 排序 输入 ， 这 个 输入 可 通过 索引 访问 或 通过 排序 来 获得 。 通 过 扫描 现 有 索引 或 在 进行 
连接 之 前 对 表 进 行 排序 就 可 以 做 到 这 一 点 。 连 接 列 不 能 是 LONG 或 LOB 字段 。 

在 合并 连接 中 ， 同 时 扫描 已 连接 的 表 。 同 时 扫 插 两 个 表 以 但 找 匹 配 行 。 外 部 表 和 内 部 
表 都 只 扫描 一 次 ,除非 外 部 表 中 有 重复 的 值 , 那样 的 话 可 能 要 再 次 扫描 内 部 表 的 东 些 部 分 。 
因为 表 通 常 上 只 被 扫描 一 次 ， 所 以 决定 哪个 是 外 部 表 、 哪 个 是 内 部 表 不 像 在 其 他 连接 方法 中 
那么 重要 。 尽 管 如 此 ， 由 于 可 能 有 重复 的 值 ， 因 此 ， 优 化 需 通 第 选择 重复 值 较 少 的 表 作 为 
外 部 表 。 但 是 ， 优 化 规 最 终 还 是 使 用 成 本 模型 来 决定 谁 是 外 部 表 ， 谁 是 内 部 表 。 

合并 连接 的 外 部 表 只 扫 拉 一次。 除非 外 部 表 中 出 现 重 复 的 值 ， 否 则 ， 凡 部 雪 也 只 扫描 
一 次 。 如 宁 有 重复 的 值 出 现 ， 那 么 可 能 再 次 扫描 内 部 表 中 的 一 组 行 。 例 如 ， 如 朱 表 Tl 和 


外 部 表 T1: 列 A 内 部 表 T2: 列 A 
2 1 
3 2 
3 2 
3 
g 


要 执行 合并 连接 ， 数 据 库 管理 堪 执 行 下 列 步 又: 
(1) 从 Tl 中 读 取 第 1 行 。A 的 值 是 “2”。 

(2) 扫 朱 IT2， 直 到 发 现 匹 配 项 ， 然 后 连接 这 两 行 。 
(3) 连续 扫描 T2， 当 列 匹配 时 ， 连 接 那些 行 。 
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(4) 当 读 取 T2 中 的 “3” 时 ， 返 回 至 Tl 并 读 取 下 一 行 。 

(39)T1 中 的 下 一 个 值 是 “3”， 它 与 T2 匹配 ， 因 此 连接 那些 行 。 

(6) 连续 扫描 T2， 当 列 匹 配 时 ， 连 接 那 些 行 。 

(7) 到 达 T2 结尾 。 

(8) 返回 全 Tl 以 读 取 下 一 行 。 注 意 Tl 中 的 下 一 个 值 与 Tl 中 的 上 一 个 值 相同 ， 因 
从 T2 中 的 第 一 个 “3” 开 始 册 次 扫 摘 T2。 数 据 库 管 理 顺 记 住 此 位 置 。 


合并 连接 成 本 = 访问 第 一 个 表 的 成 本 + 访问 第 2 个 表 的 成 本 + 排序 的 成 本 
7 .53 用 着 连接 


哈 希 连 接 需 要 如 下 形式 的 一 个 或 多 个 谓词 : TABLE1.COLUMNX=TABLE2.COLUMNY， 
在 该 形式 中 , 列 类 型 相同 。 对 于 类 型 为 CHAR 的 列 , 长 度 必须 相同 ; 对 于 类 型 为 DECIMAL 
的 列 ， 精 度 和 小 数位 必须 相同 ， 对 于 类 型 为 DECFLOAT 的 列 ， 精 度 必 须 相 同 。 列 类 型 不 
能 是 LONG 字段 列 或 大 对 象 LOB) 列 。 哈 希 连 接 可 处 理 多 个 等 式 谓 词 这 一 事实 相对 于 合并 
连接 是 一 大 优势 ， 后 者 只 能 处 理 等 慌 谓 词 。 

对 于 哈 币 连接， 首先 扫 摘 内 部 表 ( 也 称 为 构建 表 ，BUILD TABLE)， 表 中 的 行 被 复制 到 
从 排序 堆 划 出 的 内 存 缓冲 区 中 (该 排序 堆 由 sortheap 数据 库 配 置 参数 指定 )。 根 据 在 JOIN 谓 
词 的 列 上 计算 的 哈 布 什 ， 将 内 存 绥 神 区 分 为 右 干 分 区 。 如 有 果 INNER 表 的 大 小 超过 可 用 的 
排序 堆 空 间 ， 那 么 将 所 选 分 区 中 的 缓冲 区 与 入 临时 表 。 然 后 扫描 外 部 表 ( 称 为 探测 表 ， 
PROBE TABLE)。 对 于 探测 表 中 的 每 一 行 ， 对 连接 列 应 用 同一 哈 希 算法 。 如 果 所 获得 的 哈 
希 值 与 构建 行 的 哈 希 值 相 匹 配 ， 就 比较 实际 的 连接 列 。 如 果 与 探测 表 行 匹配 的 分 区 在 内 存 
中 ， 那 么 比较 会 立即 进行 。 如 果 分 区 被 写 入 临时 表 ， 那 么 探测 行 也 被 写 入 临时 表 。 最 后 ， 
处 理 包 含 同一 分 区 中 的 行 的 临时 表 以 进行 匹配 。 

由 于 将 构建 表 保 存在 内 存 中 所 具有 的 好 处 ， 优 化 堪 通 各 选择 较 小 的 表 作 为 构建 表 ， 以 
名 倪 必 须 将 该 表 洲 出 (SPILL) 到 磁盘 上 。 但 是 ， 要 再 次 强调 的 是 ， 优 化 更 成 本 模型 最 终 决 定 
哪个 表 是 内 部 表 、 哪 个 表 是 外 部 表 。 

下 面 我 们 更 深入 地 研究 哈 希 连接 如 何 利 用 SMP 系统 。 在 SMP 系统 (其 中 
INTRA PARALLEL=ON 日 DFT DEGREE>1) 中 ， 一 个 哈 希 连接 可 能 由 多 个 代理 进程 在 同 
一 个 CPU 或 多 个 CPU 上 以 并 行 方式 执行 。 在 以 并 行 方式 执行 时 ， 构 建 表 被 动态 地 分 为 多 
个 并 行 的 元 组 流 ， 每 个 流 由 独立 的 任务 人 处理 以 便 将 构建 元 组 输入 内 存 。 在 对 构建 表 流 的 处 
理 结 束 时 ， 哈 布 连接 进程 会 调整 内 存 的 内 容 ， 并 执行 任何 必需 的 将 分 区 移入 或 移出 内 存 的 
操作 。 接 下 来 ， 根 据 驻 留 内 存 的 分 区 来 处 理 探测 表 的 多 个 并 行 元 组 流 ， 并 且 在 需要 时 ， 为 
洲 出 到 临时 表 的 哈 希 连接 分 区 的 元 组 来 溢出 这 些 并 行 元 组 流 。 最 后 ， 以 并 行 方 式 处 理 溢出 
的 分 区 ， 每 个 任务 人 处理 一 个 或 多 个 溢出 的 分 区 。 
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为 了 获取 哈 硕 连接 的 所 有 性 能 效益 ， 可 能 需要 更 改 sortheap 数据 库 配 置 参数 和 


SHEAPTHRES 数据 库 管 理 豆 配置 参数 的 值 。 如 果 可 以 避免 哈 希 循环 和 次 出 到 磁盘 ， 哈 硕 
连接 性 能 最 佳 。 要 调整 哈 希 连接 性 能 ， 估 计 对 sheapthres 可 用 的 最 大 内 存量 ， 然 后 调整 


sortheap 参数 。 增 大 它 的 设置 ， 直 到 尽 可 能 避免 哈 硕 循环 和 磁盘 溢出 ， 但 不 要 达到 由 
sheapthres 参数 指定 的 限制 。 增 大 sortheap 信也 应 提高 具有 多 个 类 别 的 合 询 的 性 能 。 

一 般 来 说 , 哈 希 连接 在 OLAP 中 可 以 提高 复杂 SQL 语句 的 性 能 , 对 于 OLTP 一 般 不 建 
议 使 用 哈 希 连接 。 


7.5.4 ”选择 最 佳 连接 的 策略 


到 目前 为 止 ， 我 们 已 经 讨论 了 在 DB2 中 可 用 的 不 同 连接 方法 。 正 如 我 们 所 知 ， 初 看 
起 来 ， 某 些 方法 与 其 他 方法 相 比 是 更 好 的 选择 。 例 如 ， 与 根据 外 部 表 的 每 一 行 扫描 内 部 表 
J 钥 套 循环 连接 相 比 ， 合 并 连接 具有 只 对 表 扫 搬 一 次 的 优势 。 于 是 ， 合 并 连接 似乎 是 更 好 
的 选择 ， 但 是 ， 如 果 存 在 索引 的 话 ， 峰 套 循 环 会 是 更 好 的 选择 。 同 样 ， 与 合并 连接 相 比 ， 
哈 希 连接 似乎 是 更 好 的 选择 ， 因 为 它 不 需要 在 执行 前 对 输入 表 排 序 ， 但 如 果 我 们 需要 保持 
外 部 表 中 行 的 次 序 ， 合 并 连接 或 髋 套 循环 连接 可 能 是 更 好 的 选择 一 一 蛤 希 连 接 不 能 保证 维 
持 族 序 ， 因 为 它 可 能 溢出 到 磁盘 ， 而 那样 会 破坏 次 序 。 

那么 DB2 优化 器 如 何 针 对 特定 连接 来 决定 使 用 哪 种 连接 方法 呢 ? 首先 , 它 必 须 考 虑 查 
询 中 谓词 的 类 型 。 当 选择 了 可 能 的 连接 方法 时 ，DB2 优化 器 随后 根据 成 本 模型 和 选 定 的 优 
化 级 别 来 决定 使 用 哪 种 连接 方法 。 优 化 级 别 是 数据 库 配 置 文件 中 可 配置 的 参数 ， 它 告诉 优 
化 器 要 进行 多 大 程度 的 优化 。 这 个 值 越 高 ， 优 化 操作 就 越 多 。 优 化 级 别 可 能 的 值 为 0、1、 
2、3、5、7 和 9。 这 些 值 对 可 能 的 连接 方法 的 影响 如 下 : 

e 级 依循 环 连接 在 每 个 优化 级 别 都 可 行 。 

e 合并 连接 在 优化 级 别 1 及 以 上 级 别 是 可 行 的 。 

e 哈 斋 连接 在 优化 级 别 5 及 以 上 级 别 是 可 行 的 。 

数据 库 优化 器 会 根据 成 本 模型 来 决定 使 用 合适 的 连接 。 所 以 对 我 们 来 说 只 需要 提供 给 
优化 器 成 本 模型 必需 的 信息 : 准确 的 统计 信息 、 合 理 的 配置 参数 、 高 效 的 SQL 和 索引 以 及 
优化 级 别 。 下 面 我 们 讲 讲 优化 级 别 。 


7.6 ”优化 级 别 


优化 级 别 指定 了 各 种 优化 末 上 略 ， 当 编 详 和 优化 SQL 语句 时 ， 优 化 融 将 使 用 这 些 策 略 
连接 方法 的 选择 取决 于 正在 使 用 的 优化 级 别 。 所 以 ， 优 化 器 并 非 总 是 使 用 上 面 摘 述 的 每 种 
仓 取 路 径 技术 。 相 反 ， 根 据 优 化 级 别 ， 优 化 如 使 用 各 种 不 同 的 技术 。 优 化 级 别 的 用 途 是 通 


起- 
i 
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过 它 来 指导 DB2 何 时 采用 哪 种 优化 梨 略 和 优化 技术。 通 币 ， 优 化 磺 若 夸 的 优化 宁 略 越 多 ， 
用 于 但 询 的 存 取 方 案 束 越 好 。 然 而 ， 优 化 左 被 指 寻 考 碟 的 优化 宋 略 越 多 ,把 SQL 编译 成 可 
nition ee 0 bier 应 用 


7.6.1 优化 级 别 概述 


影响 为 SQL 语句 生成 访问 计划 的 方式 的 最 重要 因素 就 是 优化 级 别 , 优化 级 别 用 于 为 此 
任务 做 准备 。 该 信息 告诉 DB2 优化 器 要 付出 多 少 努 力 、 使 用 什么 优化 技术 来 确定 解决 查询 
的 最 佳 访问 计划 。 较 高 的 级 别 将 使 优化 堪 使 用 更 为 复杂 的 算法 和 代数 分 析 一 一 因而 也 需要 
化 费 更 多 的 准备 时 间 一 一 来 生成 最 终 的 访问 计划 。 


DB2 优化 级 别 的 历 有 7-4 所 示 。 
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= Mosl Uy 
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to use with: QLIP DLAPIDSS q ] 


图 7-4 DB2 优化 级 别 的 规则 


连接 枚 举 

连接 枚 举 算 法 是 对 优化 左 使 用 的 方案 组 合 数 的 重要 决定 因 了 于 。 优 化 硕 使 用 各 种 方法 来 
选择 但 询 的 最 佳 连接 宁 略 。 这 些 方 法 包括 下 列 搜索 条 略 ， 它 们 由 但 询 的 优化 级 别 来 确定 : 

(1) 贫 要 连接 枚 举 。 
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e 可 节省 空间 和 时 间 。 

e 单 问 枚 举 ， 一 旦 为 两 个 表 选 择 了 一 个 连接 方法 ， 在 进一步 优化 期 间 就 不 更 改 它 。 

e 当 连 接 多 个 表 时 ， 可 能 丢失 最 佳 访 问 方案 。 如 果 查 询 只 连接 两 三 个 表 ， 那 么 信 梦 
连接 枚 举 选择 的 访问 方案 与 动态 编程 连接 枚 举 选 择 的 访问 方案 相同 。 如 果 该 查询 
在 相同 的 列 上 有 多 个 连接 谓词 ( 显 式 指 定 的 或 通过 谓词 传递 闭 包 隐 式 生 成 的 )， 那么 
更 是 如 此 。 

(2) 动态 编程 连接 枚 举 。 

e 随 着 已 连接 表 数 的 增加 ， 空 间 和 时 间 需 求 按 指数 规律 增加 。 

e 名 有 效 、 全 面 地 搜索 以 获得 最 佳 访 问 方 案 。 

e 类 似 于 DB2 z/OS 所 使 用 的 策略 。 


优化 级 别 

当 编 译 SQL 或 XQuery 查询 时 ， 可 以 指定 优化 级 别 以 确定 优化 器 如 何 选择 该 查询 的 最 
有 效 访问 方案 。 可 使 用 查询 编译 中 考 虚 的 优化 策略 的 编号 和 类 型 来 区 分 优化 级 别 。 尽 管 可 
以 单独 指定 优化 技术 以 提高 查询 的 运行 时 性 能 ， 但 是 指定 的 优化 技术 越 多 ， 查 询 编 译 束 需 
要 越 多 的 时 间 和 系统 资源 。 

可 以 在 编译 SQL 或 XQuery 查询 时 指定 下 列 一 个 优化 器 级 别 : 

级 别 0; 此 级 别 指导 优化 器 使 用 最 少 的 优化 来 生成 访问 方案 。 此 优化 级 别 具 有 下 列 
特征 : 


优化 器 不 考虑 任何 非 均匀 分 布 统计 信息 。 
仅 应 用 基本 的 得 询 重 写 规则 。 
发 生 信 焚 连 接 枚 举 。 
仅 允 许 使 用 藤 套 循环 连接 及 索引 扫 摘 访问 方法 。 
在 生成 的 访问 方法 中 不 使 用 列表 预 取 。 
不 考虑 星 型 连接 策略 。 
此 级 别 应 该 只 用 于 需要 最 低 的 查询 编译 开销 的 情况 。 查 询 优 化 级 别 0 适用 于 以 下 应 用 
程序 ， 完 全 由 访问 索引 结构 良好 的 表 的 非常 简单 的 动态 SQL 或 XQuery 语句 组 成 。 
级 别 1 - 此 优化 级 别 具 有 下 列 特征 : 
e 优化 左 不 考 碟 任何 非 均匀 分 布 统计 信息 。 
e 只 应 用 碍 询 重 写 规则 的 一 个 子 集 。 
e 发 生 信 禁 连接 枚 举 。 
e 在 生成 的 访问 方法 中 不 使 用 列表 预 取 。 
除了 “合并 扫描 连接 ”及 表 扫 描 也 可 用 以 外 ， 优 化 级 别 1 类 似 于 级 别 0。 
级 别 2: 此 级 别 指导 优化 器 使 用 比 级 别 1 显著 高 的 优化 程度 ， 而 使 复杂 查询 的 编译 成 
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利用 了 所 有 可 用 的 统计 信息 ， 包 括 频 率 和 分 位 数 非 均匀 分 布 统计 信息。 
除 只 在 极 少 情况 下 才 适 用 的 计算 密集 型 规则 外 ， 将 应 用 所 有 其 他 查询 重 写 规则 ， 
包括 路 由 对 物化 查询 表 的 查询 。 
e 使 用 了 贫 健 连接 枚 举 。 
e 考虑 各 种 访问 方法 ， 包 括 列 表 预 取 和 物化 但 询 表 路 由 。 
e 如 果 适 用 ， 请 考虑 星 型 连接 策略 。 
优化 级 别 2 除了 使 用 “ 仿 禁 连接 枚 举 ” 而 不 是 “动态 编程 ”外 ， 类 似 于 级 别 5。 在 所 
有 使 用 “ 信 禁 连接 枚 举 ” 算 法 的 级 别 中 ， 此 级 别 具 有 最 高 的 优化 程度 。 与 级 别 3 及 更 融 级 
别 相 比 ， 它 对 复 林 但 询 的 蕉 代 方案 考虑 较 少 ， 因 而 消耗 的 编译 时 间 也 少 。 建 议 将 级 别 2 用 
于 决策 文 持 或 联机 分 析 人 处 理 (OLAP) 环 场 中 非常 复 林 的 人 查询。 在 这 种 环境 下 ， 特定 查 询 很 少 
完全 重复 ， 因 此 得 询 访问 方案 不 太 可 能 在 高 速 缓存 中 俘 留 到 出 现下 一 个 得 询 为 止 。 
级 别 3， 此 级 别 请 求 中 等 优化 。 此 级 别 与 DB2 MVS/ESA 版 、OS/390 或 ZOS 版 的 查 
询 优化 特征 基本 匹配 。 此 优化 级 别 具 有 下 列 特 征 : 
e 使 用 非 均 匀 分 布 统计 信息 (如 果 可 用 )， 访 统计 信息 跟踪 频繁 出 现 的 值 。 
e 应 用 大 部 分 查询 重 写 规则 ， 包 括 子 查询 全 连接 的 变换 。 
e。 动态 编程 连接 枚 举 ， 如 下 所 不 : 
> 组 合 内 部 表 的 有 限 使 用 。 
> 涉及 得 找 表 的 星 型 模 却 的 肖 卡 尔 乘 积 的 有 限 使 用 。 
e 考虑 各 种 访问 方法 ， 包 括 列 表 预 取 、 索 引 AND 运算 和 星 型 连接 。 
此 级 别 适 用 于 大 量 应 用 程序 。 此 级 别 改 进 具 有 4 个 或 更 多 连接 的 得 询 的 访问 方案 。 但 
是 ， 优 化 堪 可 能 无 法 考 层 使 用 默认 优化 级 别 选 择 的 更 好 方案 。 
级 别 $5; 此 级 别 指导 优化 器 使 用 相当 大 量 的 优化 来 生成 访问 方案 。 此 优化 级 别 具 有 下 
列 特征 : 
e 使 用 所 有 可 用 的 统计 信息 ， 包 括 频 率 和 分 位 数 分 布 统计 信息 。 
e 除 只 在 极 少 情况 下 才 适 用 的 那些 计算 密集 型 规则 外 ， 将 应 用 所 有 其 他 查询 重 写 规 
则 ， 包 括 路 由 对 物化 查询 表 的 查询 。 
e 动态 编程 连接 枚 举 ， 如 下 所 示 : 
> 组 合 内 部 表 的 有 限 使 用 。 
> 涉及 得 找 表 的 星 型 模式 的 华 卡 尔 乘积 的 有 限 使 用 。 
e 考虑 各 种 访问 方法 ， 包 括 列 表 预 取 、 索 引 AND 运算 和 物化 查询 表 足 由。 
当 优 化 费 检 测 到 不 能 保证 用 于 复 洒 动态 SQL 或 XQuery 得 询 的 其 他 资源 和 处 理 时 间 
时 ， 将 减少 优化 。 沽 少 的 苑 围 或 大 小 取决 于 机 器 大 小 和 谓词 数目 。 


本 显著 低 于 级 别 3 及 更 高 级 别 。 此 优化 级 别 具 有 下 列 特征 : 
外 
各 
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当 查 询 优 化 器 减少 查询 优化 量 时 , 它 继 续 应 用 正常 时 应 用 的 所 有 查询 重 写 规 则 。 但 是 ， 
它 的 确 使 用 了 仿 禁 联合 枚 从 法 并 减少 了 考虑 的 访问 方案 的 组 合 数 。 

对 于 由 事务 和 复杂 答 询 组 成 的 混合 环境 ， 得 询 优化 级 别 5 是 很 好 的 选择 。 此 优化 级 别 
设计 成 可 以 用 局 效 的 方式 应 用 最 有 价值 的 但 询 变 换 和 其 他 查询 优化 技术 。 

级 别 7， 此 级 别 指导 优 化 器 使 用 相当 大 量 的 优化 来 生成 访问 方案 。 级 别 7 除了 不 减少 
用 于 复杂 动态 SQL 或 XQuery 租 询 的 得 询 优化 量 外 ， 它 与 但 询 优化 级 别 $ 是 相同 的 。 

级 别 9， 此 级 别 指导 优化 器 使 用 所 有 可 用 的 优化 技术 。 这 些 主要 功能 包括 : 

e 所 有 可 用 的 统计 信息 。 

e 所 有 查询 重 写 规则 。 

e 联合 枚 举 的 所 有 可 能 性 ， 包 括 佣 卡尔 乘积 和 任意 多 种 组 合 的 内 部 结构 。 

e 所 有 访问 方法 。 

此 级 别 可 以 大 大 扩展 由 优化 器 考虑 的 可 能 访问 方案 的 数量 。 对 于 使 用 大 表 的 很 复杂 且 
运行 时 间 很 长 的 查询 ， 可 以 使 用 此 级 别 来 确定 更 全 面 优化 是 否 将 生成 更 好 的 访问 方案 。 使 
用 解释 工具 和 基准 测试 工具 来 验证 是 否 实 际 上 已 找到 更 好 的 方案 。 


7.6.2 选择 优化 级 别 


合理 地 设置 优化 级 别 可 以 提供 有 关 显 式 指定 优化 技术 的 菜 些 优点 ， 特 别 是 由 于 下 列 
原因 : 

e 管理 非常 小 型 的 数据 库 或 非常 简单 的 动态 查询 。 

e 适应 数据 库 服 务 器 上 编译 时 的 内 存 限制 。 

e 减少 查询 编译 时 间 ， 如 PREPARE 时 间 。 

通过 使 用 优化 级 别 S( 默 认得 询 优化 级 别 ), 大 多 数 语 句 都 可 以 使 用 合理 数量 的 资源 充分 
优化 。 以 给 定 的 优化 级 别 ， 查 询 编 译 时 间 和 资源 消耗 主要 受 查 询 的 复杂 性 ， 特 别 是 连接 和 
子 查询 的 数量 影响 。 但 是 ， 编 译 时 间 和 资源 的 使 用 也 受 所 执行 的 优化 数量 影响 

查询 优化 级 别 1、2、3、5 和 7 都 比较 通用 。 仅 当 需 要 进 一 步 减少 查询 编译 时 间 日 了 
解 SQL 和 义 Query 语句 相当 简单 时 ， 才 考虑 级 别 0。 


选择 优化 级 别 时 的 原则 : 

当选 择优 化 级 别 时 ， 考 虑 下 列 一 般 准 则 : 

e 通过 使 用 默认 查询 优化 级 别 (级 别 5) 开 始 。 

e 要 使 用 不 是 默认 值 的 级 别 ， 首 先 尝试 级 别 1、2 或 3。 级 别 0、1 和 2 使 用 贪 禁 连 
接 枚 举 算法 。 

e 如 果 有 许多 表 ， 这 些 表 的 同一 列 有 许多 连接 谓词 ， 并 且 又 关心 编译 时 间 ， 那 么 使 
用 优化 级 别 1 或 2。 
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e 对 于 运行 时 间 短 (不 到 1s) 的 查询 ， 使 用 低 优 化 级 别 (0 或 1)。 这 些 碍 询 趋 问 于 具有 
> 访问 单个 表 或 仅 访 问 少量 表 。 
> 访 存 一 行 或 仅 访 存 少量 行 。 
> 使 用 标准 的 唯一 索引 。 
这 种 查询 的 典型 示例 是 联机 事务 处 理 (OLTP) 事 务 。 
e 对 于 运行 时 间 较 长 (大 于 30 秒 ) 的 查询 ， 使 用 高 优化 级 别 (3、5 或 7)。 
> 级 别 3 和 更 高 的 级 别 使 用 “动态 编程 ”连接 枚 举 算法 。 与 级 别 0、1 和 2 相 比 ， 
此 算法 考虑 更 多 替代 方案 ， 并 且 可 能 使 编译 时 间 也 显著 增加 ， 特别 是 随 看 表 的 
数量 增加 ， 更 是 如 此 。 
> 仅 当 具有 查询 的 特定 异常 的 优化 需求 时 ， 使 用 优化 级 别 9。 

复杂 的 但 询 可 能 需要 不 同 程度 的 优化 ， 以 便 选 择 最 佳 访 问 方案 。 对 具有 下 列 特征 的 得 
询 考 虑 使 用 更 高 的 优化 级 别 : 

e 访问 大 型 表 
大 量 谓 词 
很 多 子 查 询 
很 多 连接 
很 多 集合 运算 符 ， 例 如 UNION 和 INTERSECT 
很 多 限定 行 
GROUP BY 和 HAVING 操作 
大 量 视图 

复 区 查询 的 典型 例子 是 对 完全 规范 化 数据 库 的 决策 支持 查询 或 月 结 报 告 查询 ， 对 于 这 
些 复杂 查询 , 至 少 应 该 使 用 默认 碍 询 优化 级 别 。 要 分 析 长 时 间 运 行 的 查询 , 可 使 用 db2batch 

运行 该 查询 以 确定 编译 和 执行 各 花费 了 多 长 时 间 。 如 果 编 译 需 要 更 长 时 间 ， 那 么 降低 优化 
级 别 。 如 果 执 行 需要 更 长 时 间 ， 那 么 考虑 更 高 的 优化 级 别 。 

对 于 由 查询 生成 器 产生 的 SQL 和 XQuery 使 用 较 高 的 查询 优化 级 别 。 许 多 查询 生成 器 
创建 运行 效率 不 高 的 查询 。 编 写 很 差 的 查询 ， 包 括 那 些 由 查询 生成 器 产生 的 查询 ， 需 要 另 
外 优化 以 选择 良好 的 访问 方案 。 使 用 查询 优化 级 别 2 和 更 高 的 级 别 可 以 改进 这 样 的 SQL 和 
XQuery 查询。 


7.6.3 ”设置 优化 级 别 
当 指 定 优化 级 别 时 ,考虑 查询 是 使 用 动态 SQL 和 XQuery 语句 还 是 静态 SQL 和 XQuery 
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语句 ， 以 及 是 否 重复 执行 同一 动态 查询 。 对 于 静态 SQL 和 XQuery 语句， 只 耗费 一 次 查询 
编译 时 间 和 资源 ， 而 产生 的 方案 可 以 使 用 许多 次 。 一 般 来 说 ， 静 态 SQL 和 XQuery 语句 应 
该 始终 使 用 默认 查询 优化 级 别 。 因 为 动态 语句 是 在 运行 时 绑 定 和 执行 的 ， 所 以 考虑 对 动态 
语句 进行 男 外 的 优化 开销 是 否 改善 总 体 性 能 。 但 是 ， 如 果 重 复 执行 相同 的 动态 SQL 或 
XQuery 语句 ， 那 么 高 速 缓存 所 选 访问 方案 。 这 种 语句 可 以 使 用 与 静态 SQL 或 XQuery 语 
句 相同 的 优化 级 别 。 

如 果 认 为 查询 可 以 从 附加 优化 中 获 益 ， 但 不 能 肯定 ， 或 者 关心 编译 时 间 和 资源 使 用 情 
况 ， 那 么 可 以 执行 一 些 基准 程序 测试 。 

要 设置 查询 优化 级 别 ， 遵 循 下 列 步骤: 

(1) 按 以 下 方式 非 正式 地 或 正式 地 测试 分 析 性 能 因素 : 

e 对 于 动态 查询 语句 ， 测 试 应 比较 该 语句 的 平均 运行 时 间 。 使 用 下 列 公 式 来 估计 平 

均 运 行 时 间 : 


在 此 公式 中 ， 重 复 次 数 表示 每 次 编译 查询 语句 时 ， 期 望 查询 语句 执行 的 次 数 。 


注意 : 

在 初始 编译 之 后 ， 当 环境 更 改 要 求 动态 SQL 和 XQuery 语句 时 ， 将 重新 编译 这 些 动态 
SQL 和 XQuery 语句 。 如 果 在 将 查询 语句 高 速 缓存 之 后 环境 不 更 改 ， 那 么 不 需要 再 次 编译 ， 
因为 后 来 的 PREPARE 语句 将 复 用 高 速 缓存 的 语句 。 


e 对 于 毅 态 SQL 和 XQuery 语句 ， 比 较 语句 运行 时 间 。 
义 管 可 能 对 静态 SQL 和 XQuery 语句 的 编译 时 间 也 感 兴趣 ， 但 该 语句 的 总 计 编 译 与 运 
行 时 间 在 任何 有 意义 的 上 下 文中 都 很 难 估 计 。 比 较 总 时 间 不 能 识 询 这 样 一 个 事实 ， 即 每 次 
将 静态 合 询 语句 绑 定 时 ， 它 可 以 运行 多 次 ， 而 在 运行 时 ， 一 般 不 将 它 绑 定 。 
(2) 可 以 在 数据 库 、 应 用 程序 和 会 话 级 别 设 置 优化 级 别 : 
e 动态 SQL 和 XQuervy 语句 使 用 CURRENT QUERY OPTIMIZATION 专用 寄存 器 指 
定 的 优化 级 别 ， 访 寄存 器 是 用 SQL 语句 SET 设置 的 。 例 如 ， 下 列 语句 将 优化 级 别 
信和 置 为 1]: 


DB2 SET CURRENT QUERY OPTIMIZATION = 1 


要 确保 动态 SQL 或 XQuery 语句 始终 使 用 同一 优化 级 别 , 可 以 将 SET 语句 包含 在 应 用 
程序 中 。 
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如 果 疝 未 设置 CURRENT QUERY OPTIMIZATION 奇人 存 堪 ,将 使 用 默认 得 询 优化 级 别 
绑 定 动态 语句 。 动 态 和 静态 租 询 的 默认 值 由 数据 库 配 置 参 数 df queryopt 的 人 确定。 级 别 $ 
是 此 参数 的 默认 值 。 绑 定 选 项 和 专用 寄存 器 的 默认 值 也 是 从 dft queryopt 数据 库 配 置 参 数 
读 取 的 。 
e 评 态 SQL 和 XQuery 语 句 在 应 用 程序 中 使 用 PREP 和 BIND 命 令 上 指定 的 优化 级 别 。 
SYSCAT.PACKAGES 目录 表 中 的 QUERYOPT 列 记 录用 于 绑 定 程序 包 的 优化 级 
别 。 如 果 以 隐 式 方式 或 使 用 REBIND PACKAGE 命令 重新 绑 定 程序 包 ， 将 把 同一 
优化 级 别 用 于 静态 查询 语句 。 要 更 改 这 种 静态 SQL 和 XQuery 语句 的 优化 级 别 ， 
可 使 用 BIND 命令 。 如 果 未 指定 优化 级 别 ， 那 么 DB2 使 用 dft queryopt 数据 库 配 
置 参数 指定 的 默认 优化 级 别 。 
e 如 条 没有 在 会 话 和 应 用 程序 级 别 制 定 优化 级 别 ， 那 么 默认 将 使 用 数据 库 级 别 的 优 
化 级 别 ， 可 以 设置 数据 库 配 置 参数 dft queryopt 来 更 改 数据 库 的 优化 级 别 ， 这 个 参 
数 是 全 局 级 的 ， 会 影响 数据 库 中 的 所 有 应 用 程序 和 “ SQL。 下 和 面 是 设置 数据 库 优 化 
级 别 为 1 的 示例 : 


db2 update db cfg for sample using dft queryopt 7 


7.7 基于 规则 的 优化 


7.7.1 优化 器 概要 文件 概述 


大 多 数 主 流 关 系数 据 库 管理 系统 ， 例 如 DB2、Oracle、Informix 和 SQL Server 都 依赖 
于 基于 成 本 的 优化 器 设计 ,在 数据 库 服务 器 环境 中 的 一 组 经 常 变化 的 条 件 (包括 变化 的 查询 
特征 和 数据 ) 的 影响 下 ， 从 很 多 可 能 的 计划 中 选择 最 佳 SQL 执行 计划 。 具 体 而 言 ， DB2 数 
据 库 SQL 优化 的 决定 受 系 统 配置 IO 存储 特征 .CPU 并 行 性 和 速度 、 绥 冲 池 和 排序 堆 设 置 、 
通信 市 宽 )、 模 了 式 (索引 、 约 束 )、DB2 注册 变量 、DB2 优化 级 别 和 统计 信息 (关于 表 、 列 和 
索引 的 统计 信息 ) 的 影响 。 这 么 多 复杂 的 因 闵 ， 册 加 上 数据 本 身 的 动态 性 ， 使 得 最 佳 计划 的 
评估 对 于 任何 数据 库 系 统 而 主 通 常 都 是 复兴 的 过 程 。 

很 多 人 都 曾 在 应 用 程序 中 碰 到 这 样 的 情况 : 大 多 数 查 询 工 作 负 和 载 都 经 过 了 适当 的 调 
优 ， 并 取得 了 较 好 的 性 能 ， 但 是 随 看 用 户 期 望 的 增长 ， 加 上 系统 的 复 淋 性 和 多 样 性 ， 仍 然 
有 少许 SQL 语句 无 法 通过 调 优 取得 预期 的 性 能 。 虽然 人 们 已 经 尽 了 最 大 的 努力 , 试图 通过 
改变 数据 库 ( 例 如 使 用 索引 建议 髓 或 其 他 方法 来 改进 索引 、 更 新 统计 信息 、 改 善 数据 群集 及 
更 改 参数 ) 来 调 优 SQL 语句 ， 但 是 问题 仍然 存在 。 有 有 时候， 我们 希望 更 再 接地 影响 优化 堪 ， 
同时 尽量 避免 更 改 应 用 程序 。 
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这 时 候 我 们 可 以 考虑 使 用 基于 规则 的 优化 器 一 一 优化 概要 文件 。 然 而 需要 注意 的 是 ， 
先进 的 优化 器 在 生成 特定 的 访问 计划 时 ， 必 然 有 其 原因 ， 所 以 在 应 用 优化 概要 文件 之 前 ， 
务必 理解 是 什么 原因 导致 查询 的 性 能 低下 。 优 化 概要 文件 使 用 起 来 并 不 难 ， 但 更 具有 挑战 
性 的 任务 是 根据 给 定 的 数据 库 环境 判断 SQL 语句 的 问题 出 在 哪里 ， 并 选择 适当 的 优化 概 
要 加 以 应 用 。 

DB2 优化 概要 文件 可 以 将 规则 传递 给 优化 器 ， 用 于 指导 优化 右 为 SQL 查询 生成 所 需 
的 执行 计划 ， 以 敌 盖 默认 的 成 本 模型 。 这 一 点 类 似 于 Oracle 和 Informix 数据 库 中 的 RBO 
优化 器 (在 SQL 语句 中 应 用 HINT)。 优 化 概要 文件 是 包含 一 个 或 多 个 SQL 语句 的 优化 准则 
的 XML 文档 .通过 使 用 SQL 文本 和 明确 标识 SQL 语句 所 需 的 其 他 相关 信息 建立 每 个 SQL 
语句 与 其 关联 的 优化 准则 之 间 的 通信 。 


优化 概要 文件 的 工作 原理 

首先 选择 一 组 想 要 影 啊 其 访问 计划 的 租 询 。 然 后 ， 将 这 些 人 得 询 和 一 些 适 当 的 指南 放 到 
XML 优化 概要 文件 中 。 为 了 通过 验证 ，XML 优化 概要 文件 必须 遵从 优化 指南 XML 模式 ， 
并 由 一 些 区 段 组 成 。 下 面 的 XML 优化 概要 文件 演示 了 如 何 使 用 优化 概要 文件 将 优化 准 见 
传递 给 DB2 优化 问 : 

<2Xml Verslon="1.0"” encoding="UTF-8"?> 

<OPTPROFILE VERSION= 10 .5.0.6 ”> 


<!—— Optional zero or one Global sectlLon 一 -> 
<OPIGUIDELINES> 

<MOT NAME="DB2ADMIN .MOT1"/ > 
</OPTGUIDELINES> 
<!l—— Zero or more Statement profile section.——> 


<STMTPROFILE ID="Query 0"> 
<STMTKEY SCHEMA="DB2ADMIN"> 
<1l|[CDATA[select c2 from tl1 where cl=100]1> - 注 ;: 要 优化 的 So 语句 
</STMTKEY> 
<!—— Gulideline for Query 0-—> 
<OPTGUIDELINES> 
<IXSCAN TABID="T1" INDEX="T1X"/> - 注 : 优化 规则 ， 对 表 Ql 使 用 索引 T1X 扫描 
</OPTGUIDELINES> 
</STMTPROFILE> 
</OPTPROFILE> 


XML 优化 概要 文件 以 OPTPROFILE 区 段 开始 ， 该 区 段 表 明 版 本 属性 。 这 个 全 局 区 段 
将 规则 全 局 地 应 用 到 所 有 SQL 语 名 上。 例如， 可 以 指定 使 用 哪个 REOPT 选项 ， 使 用 哪个 
MQT 表 ， 或 者 使 用 什么 样 的 查询 优化 。 每 个 STMTPROFILE 元 素 都 为 应 用 程序 语句 提供 
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一 组 优化 准则 。STMTPROFILE 区 段 则 表明 将 哪些 特定 的 规则 应 用 于 STMTKEY 元 素 中 的 
SQL 语 人 上。 

如 果 有 问题 的 SQL 和 奉 询 不 容易 访问 到 ， 那 么 舍 助 XML 优化 概要 文件 可 以 市 来 很 大 的 
方便 。 例 如 ，SQL 得 询 可 能 处 在 一 个 应 用 程序 中 ， 而 这 个 应 用 程序 是 不 能 更 改 的 。 在 这 种 
情况 下 ， 可 以 使 用 概要 文件 ， 在 查 斧 文本 成 功 L 配 之 后 ， 通 过 触发 与 查询 相关 联 的 优化 概 
要 文件 来 影响 查询 行为 。 该 环境 中 的 所 有 SQL 语句 将 尝试 从 活动 的 优化 概要 文件 中 查找 匹 
配 项 ， 而 这 种 匹配 是 局 效率 、 低 开销 的 。 


7.7.2 启用 优化 概要 文件 


一 个 数据 库 中 可 以 有 很 多 个 优化 概要 文件 ， 但 是 在 实际 情况 中 ， 更 灵活 的 做 法 是 创建 
一 个 主 优化 概要 文件 ， 将 所 有 规则 (STATEMENT PROFILE) 组 织 在 一 起 ， 然 后 只 激活 此 概 
要 文件 ， 根 据 应 用 程序 环境 的 不 同 ， 可 以 选择 以 下 几 种 方法 之 一 来 激活 优化 概要 文件 。 另 
外 ， 还 需要 将 DB2 OPTPROFILE 注册 变量 设置 为 YES。 


1) 在 CLP 环境 中 

使 用 “SET CURRENT OPTIMIZATION PROFILE=DB2ADMIN.PROF1” 语 句 在 会 话 级 
将 概要 文件 与 所 有 SQL 语句 关联 , 直到 连接 重 置 或 概要 文件 重 置 。 这 条 语句 还 可 以 嵌入 到 
应 用 程序 中 。 


2) 对 于 CLI 应 用 程序 或 使 用 旧 的 JDBC 驱动 程序 的 JDBC 应 用 程序 

在 DB2CLIINI 配置 文件 中 设置 CURRENTOPTIMIZATIONPROFILE 关键 字 来 关联 优 
化 概要 文件 ,例如 对 于 SAMPLE 数据 库 , 这 个 关键 字 是 在 DATA SOURCE 区 段 中 设置 的 ， 
如 下 所 未 : 

[SAMPTE ] 

CURRENIOPEIIMIZATIONPEROFTILE=DB2ADMIN .PROFE1 


gs 


经 过 这 样 设置 后 ， 应 用 程序 执行 中 的 SQL 将 尝试 与 DB2ADMIN.PROF1 中 的 SQL 语 
句 进 行 匹 配 ， 查 找 指 定 的 规则 ， 这 些 规则 将 覆盖 执行 环境 中 常规 的 优化 。 

3) 对 于 使 用 JCC UNIVERSAL DRIVER 的 JDBC 应 用 程序 

采用 JCC UNIVERSAL DRIVER 的 JDBC 应 用 程序 并 不 使 用 DB2 CLI 层 ,虽然 可 以 将 
系统 包 和 绑 定 文件 与 动态 SQL 执行 相关 联 ， 但 最 好 的 做 法 是 将 “SET CURRENT 
OPTIMIZATION PROFILE ”语句 车 入 在 Java 应 用 程序 中 ， 在 会 话 级 关联 概要 文件 。 


4) 对 于 SQL PL 过 程 
在 创建 SQL PL 过 程 之 前 ， 使 用 SET ROUTINE OPTS 过 程 调 用 将 优化 概要 文件 的 名 
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称 与 DB2 中 特定 的 SQL PL 相关 联 。 如 下 所 示 : 
CALEDL SYSPROC .SET _ ROUTINE, OOPS OPTPROFTLE DB2ADMIN .PROF1'"') 


SQL PL 过 程 包含 的 SQL 语句 具有 一 些 执行 属性 ， 例 如 隔离 级 别 或 优化 级 别 ， 这 些 属 


性 只 能 通过 DB2 SQLROUTINE PREOPTS 注册 变量 来 覆盖 。 也 可 以 用 SYSPROC.SET 


ROUTINE OPTS 过 程 上 黎 辣 该 选项 。 要 激活 概要 文件 ， 可 以 使 用 该 存储 过 程 来 天 联 优化 概 
要 文件 。 


5) 对 于 C/C++ 应 用 程序 中 的 能 入 式 SQL 
对 于 藤 入 式 和 应 用 程 | 吝 ， 使 用 OPTPROFILE 绑 定 选项 。 藤 入 式 SQC 程序 需要 使 
用 PREP 命令 来 编译 ， 该 命令 将 创建 绑 定 文件 。 这 个 绑 定 文件 需要 通过 OPTPROFILE 选项 
绑 定 到 数据 库 ， 例 如 执行 下 面 的 全 命令 : 


db2 bind progl.bnd OPTPROFILE DB2ADMIN .PROFE1 


6) 对 于 含 胖 入 式 静态 SQL 语句 的 SQLJ Java 应 用 程序 
在 定制 阶段 使 用 BINDOPTIONS 参数 关联 概要 文件 。 静 态 SQLJ 程序 PROGI1 按 如 下 
所 示 进 行 翻译 和 编译 : 


sql] progl .sql] 

db2sqljcustomize -Url Jdbc:db2://SERVER: PORT/SAMPLE -user USER -password 
PASSWORD -blndoptlions "OPTPROFILE DB2ADMIN.PROF1™ -Storeblndopt1ons 
Progl SJProafyled 


所 有 使 用 旧 的 JDBC 驱动 程序 的 JDBC 程序 ， 都 将 使 用 DB2CLLINI 中 的 设置 。 使 用 
UNIVERSAL JDBC 驱动 程序 的 JDBC 程序 属于 上 述 第 (3) 类 情况 .需要 注意 的 是 ,由 于 SQLJ 
为 SELECT SQL 语句 生成 隐 式 的 “DECLARE CURSOR” 子 句 ， 因 此 为 了 使 优化 概要 文件 
得 到 应 用 ， 优 化 概要 文件 除了 包括 SELECT 语句 外 ， 还 需要 包括 “DECLARE CURSOR” 
了 

当 应 用 程序 执行 时 ， 将 SQL 与 活动 的 概要 文件 中 的 规则 相 比 较 。 如 末 存 在 匹配 的 
STMTKEY， 优 化 规则 整 会 开始 起 作用 ; 反之 ， 假如 优化 规则 被 认为 是 不 适用 的 或 无 效 的 ， 

那么 会 返回 RC=13 的 SQL0437W。DB2 解释 工具 对 于 帮助 确定 优化 规则 是 否 被 选择 非 帝 
有 用 。 解 释 工 具 的 输出 会 指明 优化 概要 文件 的 名 称 和 有 效 的 优化 规则 。 概 要 文件 中 的 优化 
规则 通 负 履 辣 用 于 应 用 程序 设置 的 种 规 优 化 ， 从 而 使 概要 文件 能 够 更 好 地 控制 计划 评估 。 


7.7.3 优化 概要 文件 使 用 示例 
优化 概要 文件 中 的 任何 优化 规则 都 必须 遵从 DB2 提供 的 XML 模式 。 如 果 没 有 正确 地 
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指定 优化 规则 , 那么 优化 规则 将 无 效 , 并 且 在 大 多 数 情 况 下 , 将 返回 RC=13 的 SQL0437W。 
局 用 优化 概要 文件 前 必须 设置 db2 optprofile 注册 变量 。 此 变量 是 DB2 内 部 变量 ， 不 能 通 
过 “db2set -lr” 命 令 看 到 ， 不 过 在 设置 成 YES 之 后 可 以 通过 “db2set -all” 命 令 看 到 。 优 
化 概要 文件 存储 在 名 为 systools.opt profile 的 表 中 。 如 果 从 这 个 表 中 更 新 或 删除 指 凋 ， 那么 
需要 通过 发 出 FLUSH OPTIMIZATION PROFILE CACHE 语句 更 新 缓存 ,使 之 可 以 被 使 用 。 
需要 注意 的 是 ，SQL 语句 测试 匹配 是 大 小 写 敏 感 的， 但 在 尝试 匹配 之 前 ，DB2 将 去 除 宛 余 
空格 和 控制 字符 。 

可 以 通过 下 面 两 种 方法 来 创建 该 表 : 

(1) 调用 sysinstallobjects 过 程 : 

db "call SYSmnstallobTeeEsI op Pecries ec >) 

(2) 发 出 CREATE TABLE 命令 : 

CREATE TABLE SYSTOOLS.OPT PROFILE ( 

SCHEMA VARCHAR (128) NOT NULL，- 注 ; 优化 概要 文件 的 模式 限定 符 。 

NAME ”VARCHAR(128) NOT NULL，- 注 ， 指定 优化 概要 文件 名 称 ， 不 能 超过 128 个 字符 。 


PROFILE BLOB (2M) NOT NULL , - 注 : 用 于 定义 优化 概要 文件 的 XML 文档 
PRIMARY KEY ( SCHEMRA，NRAME ) ) ;=- 注 ， 表 的 主键 


假设 我 们 准备 使 用 的 优化 概要 为 DB2ADMIN.PROF1, 存放 XML 的 文件 为 DB2ADMIN. 
PROF1 XML， 创 建 的 PROFILEDATA 文件 将 包含 以 下 内 容 : 
“DB2ZADMIN , "PROF]™", "DB2ADMIN . PROF] .xml™ 


然后 使 用 下 面 的 IMPORT 命令 将 PROFILEDATA 文件 中 的 内 容 导 入 到 表 SYSTOOLS.OPT 
PROFILE 中 : 


IMPORT FROM profiledata OF DEL MODIFIED BY LOBSINFILE INSERT UPDATE INTO 
SYSTOOLS .0PT PFROFILE 

如 果 希 望 删除 不 需要 的 优化 概要 文件 ， 使 用 正常 的 DELETE 语句 删除 即 可 。 

由 于 下 面 的 示例 都 是 使 用 DB2 命令 行 工具 进行 的 ， 因 此 需要 进行 以 下 设置 ， 让 DB2 
CLP 使 用 优化 概要 文件 DB2ADMIN.PROF1: 


sdb2 SET CURRENT OPTIMIZATION PROFILE DB2ADMIN .PROF] 


下 面 的 例子 演示 了 优化 概要 文件 在 (3) 类 情况 下 的 使 用 一 一 津 规 优化 、 合 询 草 与 和 计划 
优化 。 
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例 7-1 总 十 使 用 索引 TIX( 计 划 优 化 )。 
假设 在 表 Tl 的 (C2, C1) 列 上 有 一 个 索引 TIX。 根据 优化 器 的 成 本 计算 , 对 于 以 下 查询 ， 
会 村 致 表 扫 插 。 下 和 面 的 代 人 展示 了 如 何 强 制 使 用 索引 : 


<STMTPROFILE ID="Guideline for query 1"> 
<STMTKEY SCHEMA~—"KCHEN"> 
<!l [CDATA|[select c2? from tl1 where cl=?||1> 
</STMTKEY> 
<OPTGUIDELINES> 
<IXSCAN TABID="T1"™ INDEX="T1X"/> 
</OPTGUIDELINES> 
</STMTPROFILES> 


例 7-2 总 是 使 用 REOPT( 常 规 优化 )。 
可 以 使 用 REOPT 优化 规则 ， 将 得 询 优化 推迟 到 运行 时 输入 变量 已 知 的 时 候 。 可 能 的 
选项 有 ONCE、ALWAYS 或 NONE， 如 下 所 示 : 


<STMTPROFILE ID="Guldeline for query 2"> 
<STMTKEYS> 
<!l!|ICDATA|[select c4 from 七] where cl = ?|11> 
</STMTKEY> 
<OPTGUIDELINES> 
<REOPT VALUE="ALWAYS"'/> 
</OPTGUIDELINES> 
</STMTPROFILE> 


例 7-3 只 使 用 DB2 中 的 “Optimization Level 0”( 第 规 优 化 )。 
通常 ， 对 于 应 用 程序 而 癌 ， 优 化 级 别 是 固定 的 ， 但 是 如 果 要 使 一 条 特定 的 SQL 语句 
在 不 同 的 优化 级 别 上 执行 ， 那 么 可 以 创建 以 下 优化 概要 文件 : 


<STMTPROFILE ID="Guideline for query 3"> 
<STMIKEY> 
<!|ICDATA|select * from tl1 Where cl = 211»> 
</STMTKEY> 
<OPIGUIDELINES> 
<ORYOPT VALUE="0"></QRYOPTS> 
</OPTGUIDELINESS 
</STMTPROFILES> 


例 7-4 只 使 用 DB2 中 的 “RUNTIME DEGREE ANY”( 常 规 优 化 )。 
可 以 有 很 多 方法 来 修改 内 部 分 区 的 查询 的 运行 时 等 级 。 下 面 的 代码 展示 了 优化 概要 文 
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件 如 何 为 得 询 指定 运行 时 等 级 以 及 如 何 影 啊 得 询 的 执行 : 


<STMTPROFILE ID="GuldellIne for query 4"> 
<STIMTIKEY> 
<!l [CDATA|[select * from tl1 Where cl = 3|1> 
</STMTKEY> 
<OPTGUIDELINES> 
<DEGREE VALUE="ANY"></DEGREE> 
</OPTGUIDELINES> 
</STMTPROFILES 


例 7-5 INLIST 改 为 散 侠 循环 连接 (查询 重 写 )。 
将 值 列 表 (INLIST) 改 为 使 用 GENROW 函数 非常 有 效 ， 可 以 提高 查询 的 性 能 。 在 这 个 
例子 中 ， 值 列表 放 在 内 存 的 一 个 表 中 : 


<STMTPROFILE ID="Guideline for query 5"> 
<STMTKEY> 
< ICDATALSEEECT SS .3 NAME 3.5 SUPPEEY. PS2P35 PARTREY. 
Po sla Pb ETPEE,. SD- ALLION 
FROM ECHEN.PARTS 上， KCHEN.SUPPLIERS SS, KCHEN.PARTSUPP PS 
WHERE P PARTKEY = PS.PS PARTKEY AND 
3 DUDPPKEY = PosPs SUPPREY AND 
P.P TYPE IN ( BRASS ， BRONZE ) AND 
P PSTIZE TIN 31 31,. 33 34) AND 
S-S NATION = “PERU | |> 
</STMTKEY> 
<OPIGUIDELINES> 
<INLIST2JOIN TABLE="P" COLUMN="P TYPE" OQPTION="ENABLE"'/> 
</OPTGUIDELINES> 
</STMTPROFILE> 


例 7-6 于 但 询 改 为 连接 (得 询 重 与)。 
在 这 个 例子 中 ， 在 得 询 重 与 期 间 ， 通 过 使 用 市 ENABLE 属性 的 SUBQ2JOIN， 将 子 奏 
询 转 换 成 连接 ， 以 使 更 好 地 对 其 进行 优化 : 


<STMTPROFILE ID=" Guldellne for gquery 6"> 
<STMTKEY> 
< [CDATALSELECT PS.PS PARTKEY, COUNT (DISTINCT PS.PS SUPPKEY) 
FROM FCHEN. PARTSUPP PS, KCHEN.LINELTEM 
WHERE PS.PS PARTREY = LL PARTIKEY AND 
PS.PS PARTKEY = ANY ( 
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SELECT P 上 上 ARTREYT FROM KCHEN. PARTS 
WHERE P BRAND <> ‘'‘Brand#45" AND 
P NAME='Peach snow puff bisque misty' 
AND BP TYEE <> TIN) 
GROUP BY PS PARTKEY| | > 
</STMTKEY> 
<ODPIGUILIDELINES> 
<SUBQ2JOIN OPTION="ENABLE™ /> 
</OPTGUIDELINES> 
</STMTPROFILE> 


例 7-7 影响 连接 顺序 (计划 优化 )。 

通常 ， 但 询 的 连接 顺序 在 很 大 程度 上 决定 了 人 查询 的 执行 性 能 ， 因 为 越 旱地 过 小 行 ， 戏 
率 越 蜗 。 可 以 使 用 以 下 优化 规则 来 影 啊 连 接 顺 友 。 注 意 ， 当 出 现 多 个 表 引 用 时 ， 使 用 
TABLEID 属性 而 不 是 TABID 属性 : 


<STMTPROFILE ID="Guideline for query 7"> 
<STMTKEY> 
CNAlselect From Td EI PT3 E73. TZ B72 TI Ei 
where til.cl = tj2.cl and 
ti2.c2 = 七 /4.C2 and 
EE E13 And 
ti ES and 
til.c3 = ti4.c3 and 
E203 = E73-.C311> 
</STMTKEY> 
<OPTGUIDELINESS> 
<MSJOIN FIRST="TRUE"” outermost="true"> 
<ACCESS TABLEID="t71"/> 
<MSJOIN> 
<ACCESS TABLEID="t173"/> 
<ACCESS TABLEID=—"t 7/74"/»> 
</MSJOIN> 
</MSJOIN> 
</OPTGUIDELINESS> 
</STMTPROFILE> 


例 7-8 ”强制 使 用 索引 扫 插 。 
对 下 面 的 语句 由 于 是 从 EMP1 中 选择 全 部 数据 ， 因 而 正 币 情 况 下 会 进行 全 表 扫 描 : 


SELECT * FROM EMP] 
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在 仿造 EMPLOYEE 表 对 EMP1 在 EMPNO 列 上 建立 主键 索引 后 ， 就 可 以 使 用 下 面 的 
优化 概要 文件 强制 该 SQL 先 走 EMP1 的 主键 索引 ， 然 后 再 根据 RID 读 取 数据 ; 


<2xml version="1 .0" encoding="UTF-—8"?> 
<OPTPROFILE version="10.5.0.6"> 
<STMTPROFILE 1id="testoptprofile"> 
<STMTKEY SCHEMA= DB2ADMIN > 
SELECT * FROM EMP1 ， - 注 : SQL 语句 必须 匹配 ， 注 意 大 小 写 和 空格 
</STMTKEY> 
<OPIGUIDELINES> 
<IXSCAN TABLE="EMP1" />  - 注 ; 要 求 使 用 索引 进行 扫描 
</OPTGUIDELINES> 
</STMTPROFILE> 
</OPTPROFILE> 


使 用 db2exfmt 得 到 以 下 执行 计划 : 


Profile Information: 


OPT PROF: (Optimization Profile Name) 


DB2ADMIN .PROF1 - 注 : 使 用 的 概要 文件 
Ts 第 肯 
/----+---\ 
42 42 
IXSCAN TABLE: DB2ADMIN - 注 ; 使 用 索引 扫描 
( 3) EMP1 
0 0375529 
0 
| 
42 
INDEX: DB2ADMIN 
CC1230805503781 


例 7-9 强制 使 用 表 扫 摘 。 

当 执 行 下 面 的 语句 时 ， 由 于 EMP1 的 EMPNO 列 存 在 主键 索引 ， 因 此 正常 情况 下 会 进 
行 索引 扫 质 : 

SELECT >* EROM EMPE1L WHERE EMENO= OUOUU10 


使 用 下 面 的 优化 概要 文件 ， 要 求 优化 毁 二 接 使 用 表 扫 描 : 
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< 2xml version="1 .0™" encoding "UTF 8"23 
<OPTPROFILE version="10.5.0.6"> 
<STMTPROFILE 1id="testoptprofile™"> 
<STMTKEY SCHEMA= DB2ADMTIN > 

SELECT * FROM EMP] WHERE EMPNO="000010" 
</STMTKEYS> 
<OPIGUIDELINESS> 
<TBSCAN TABLE="EMP1" /> - 注 : 要 求 使 用 表 扫 描 
</OPTGUIDELINES> 
</STMTPROFILE> 
</OPTPROFILE> 


使 用 db2exfmt 得 到 以 下 执行 计划 : 


Profile Information: 
OPT PROF: (Optimization Profile Name) 
DB2ADMIN . PROF1 - 注 : 使 用 的 概要 文件 


TBSCAN - 注 : 使 用 表 扫 摘 
( 了 二 ) 
7.60795 
和 
| 
42 
TABLE: DB2ADMIN 
EMP1 


上 面 举 了 一 些 使 用 优化 概要 文件 的 例子 ,， 其实 DB2 的 优化 占 无 比 强 大 , 通 弟 情况 下 很 
少 有 机 会 用 到 优化 概要 文件 ， 而 且 要 强调 的 是 优化 概要 文件 不 是 万 能 药 ， 只 是 止痛 药 。 只 
有 在 万 不 得 已 的 情况 下 才 使 用 优化 概要 文件 。 一 般 来 说 ， 对 于 优化 嚣 问题， 用户 应 该 尽量 
找到 根本 原因 (root cause)， 而 不 是 午 单 地 指定 优化 概要 文件 了 事 。 
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7.8 ”如何 影响 优化 器 来 提高 性 能 


我 们 已 经 理解 了 优化 器 的 工作 原理 和 组 件 ， 优 化 器 能 否 正 津 高 效 工 作 取 决 于 我 们 需 : 
提供 的 影响 优化 器 工作 的 如 下 重要 性 能 准则 。 因 此 , 只 要 记 住 这 些 影响 DB2 优化 器 的 准则 ， 
就 可 以 实现 这 些 准 则 以 获得 更 好 的 SQL 性 能 。 


7.8.1 使 DB2 统计 信息 保持 最 新 


如 果 没有 存储 在 DB2 系统 目录 中 的 统计 信息 ， 优 化 器 在 优化 任何 事物 时 都 会 遇 到 困 
难 。 这 些 统计 信息 向 优化 器 提供 了 与 正在 被 优化 的 SQL 语句 将 要 访问 的 表 和 索引 相关 的 信 
息 。 同 时 当 数据 分 布 不 均匀 时 考虑 收集 分 布 统计 信息 ， 当 存在 多 个 谓词 相关 时 考虑 收集 列 
组 统计 信息 。 


7.8.2 ”构建 适当 的 索引 


也 许 为 保证 最 佳 DB2 应 用 程序 性 能 可 以 做 的 最 重要 的 事 就 是 根据 应 用 程序 使 用 的 查 
询 创 建 正确 的 索引 。 创 建 的 索引 不 是 多 多 益 善 ， 而 是 要 遵循 一 些 创 建 索 引 的 原则 。 例 如 ， 
考虑 以 下 这 条 SQL 语句: 


SELECT LASTNAME, SALARY 


FROM EMP 
WHERE, EMPNO = "000010" 
AND DEPTNO = “DU1L 


什么 索引 会 对 这 个 简单 查询 有 作用 ? 首先 ， 考 虑 可 以 创建 的 所 有 可 能 的 索引 。 第 1 个 
简短 列表 可 能 看 起 来 如 下 : 
e 上 MPNO 上 的 INDEXI1 
e DEPTNO 上 的 INDEX2 
e。 EMPNO 和 DEPTNO 上 的 INDEX3 
这 是 一 个 好 的 开始 ，INDEX3 可 能 是 最 好 的 。 它 让 DB2 使 用 索引 来 立即 查找 满足 
WHERE 子 句 中 的 两 个 简单 谓词 的 行 。 当 然 ， 如果 已 经 有 许多 关于 EMP 表 的 索引 ， 也 许 应 
该 检查 再 创建 男 一 个 关于 表 的 索引 所 市 来 的 影响。 要 考虑 的 因素 包括 : 
e 修改 影响 ， DB2 将 目 动 维护 每 个 索引 。 这 表示 对 该 表 的 每 个 INSERT 和 DELETE 
都 将 不 仅 在 表 中 插入 和 删除 ， 而 且 会 在 其 索引 中 插入 和 删除 。 如 果 对 在 索引 中 的 
列 的 值 进行 UPDATE 操作 ， 那 么 还 更 新 了 该 索引 。 因 此 索引 加 快 了 检索 过 程 的 速 
度 ， 但 减 慢 了 修改 的 速度 。 
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e。 现 有 索引 中 的 列 : 如 果 在 EMPNO 或 DEPTNO 上 已 经 有 了 一 个 索引 ， 那 么 创建 另 
一 个 关于 该 组 合 的 索引 也 许 并 不 明智 。 但 是 ， 更 改 另 一 个 索引 以 添加 缺少 的 列 也 
许可 以 起 作用 。 但 也 不 一 定 ， 因 为 索引 中 列 的 顺序 也 许 会 根据 查询 而 有 很 大 差异 。 
例如 ， 考 虑 以 下 查询 : 


SELECT LASTNAME, SALARY 


FEF ROM EMP 

WHERE, EMPNO = "O000010" 

AND DEPTNO > “UL 

在 这 种 情况 下 ， 在 索引 中 应 该 首先 列 出 EMPNO。 然 后 列 出 DEPTNO， 从 而 允许 
DB2 对 第 1 列 (EMPNO) 执 行 直 接 索 引得 找 ， 然 后 针对 大 于 号 C) 扫 摘 第 二 列 
(DEPTNO). 


而 且 , 如 果 已 经 存在 天 于 这 两 列 的 索引 (一 个 天 于 EMPNO, 为 一 个 天 于 DEPTNO)， 
DB2 可 以 使 用 它们 来 满足 该 查询 ， jefe 一 个 索引 也 许 是 没有 必要 的 。 

e 特定 查询 的 重要 性 : 查询 越 重 要 ， 可 能 就 越 应 该 通过 创建 索引 来 进行 调 优 。 如 果 
gation ms omensoty 那么 应 该 确保 它 提供 最 佳 性 能 。 因 此 ， 为 
特定 查询 构建 索引 是 很 重要 的 。 反 之 ， 职 员 的 查询 也 许 就 没有 必要 看 得 那么 重 ， 
所 以 也 许 应 访 利 用 现 有 索引 来 执行 租 询 。 当 然 ， 决 定 取决 于 应 用 程序 对 业务 的 重 
要 性 ， 而 不 只 是 用 户 的 重要 性 。 

索引 设计 涉及 的 内 容 比 到 目前 为 止 我 们 上 面 讨 论 的 要 多 得 多 。 例 如 ， 也 许 要 考虑 索引 

pe eee niin 
也 许 只 使 用 索引 就 可 以 满足 该 请 求 。 请 考虑 我 们 前 面 的 SQL 语句 。 给 定 了 关于 EMPNO 和 
DEPTNO 的 信息 ， 我 们 要 寻找 LASTNAME 和 SALARY。 我 们 还 从 创 建 关 于 EMPNO 和 
DEPTNO 列 的 索引 开始 。 如 果 我 们 在 索引 中 还 包含 了 LASTNAME 和 SALARY， 就 不 再 
需要 访问 EMP 表 , 因为 我 们 需要 的 所 有 数据 都 已 经 在 索引 中 。 该 技术 可 以 大 大 提高 性 能 ， 
因为 它 减少 了 IO 请 求 的 数量 。 

请 记 住 :使 每 个 查询 成 为 完全 索引 访问 是 不 谨慎 ， 甚 至 也 是 不 可 能 的 。 应 该 谨慎 使 用 

该 技术 以 便 应 用 于 特别 坏 手 或 重要 的 SQL 语句 。 


7.8.3 配置 合理 的 数据 库 配 置 参 数 


优化 堪 在 工作 时 ， 需 要 读 取 相关 数据 库 配 置 参 数 ， 这 些 影 啊 最 直接 、 最 重要 的 配置 参 
数 如 下 : 
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e avg_appls( 和 平均 应 用 程序 ): 此 参数 表示 为 数据 库 并 发 运行 的 应 用 程序 平均 数量 。 
DB2 使 用 此 信息 来 确定 排序 空间 和 缓冲 池 使 用 得 有 多 么 频繁 ， 并 确定 查询 能 够 使 
用 的 空间 有 多 少 。 

e sortheap( 排 序 堆 )， 排序 堆 是 执行 排序 时 可 用 的 内 存 空间 数量 。 如 果 排 序 需 要 的 内 
存 多 于 排序 堆 中 的 可 用 内 存 ， 那 么 部 分 排序 数据 将 不 得 不 分 页 到 磁盘 上 (这 会 对 性 
能 造成 严重 的 负面 影响 )。 

e locklist( 锁 列表 ): 该 参数 表示 DB2 可 用 于 存储 各 应 用 程序 的 锁定 信息 的 内 存 数量 。 
如 果 锁 列表 空间 过 小 ， 那 么 DB2 可 能 必须 逐步 升级 (escalate) 部 分 锁 ， 以 便 为 应 用 
程序 具有 的 所 有 锁 腾 出 空间 。 

e maxlocks( 最 大 锁 列表 百分比 ): 该 参数 控制 整个 锁 列 表 空 间 中 有 白 分 之 多 少 的 完 间 
可 为 应 用 程序 所 有 。 如 果 应 用 程序 具有 过 多 的 开放 锁 ， 从 而 试图 占用 过 多 的 内 存 ， 
DB2 将 升级 部 分 锁 以 释放 锁 列 表 中 的 空间 ， 这 会 影响 并 发 性 能 。 

。 num_freqvalues( 频 繁 值 数 ): RUNSTATS 实用 工具 使 用 频繁 值 数 来 控制 DB2 将 在 
内 存 中 保留 多 少 使 用 频率 最 高 的 值 。 优 化 器 使 用 该 信息 来 确定 WHERE 子 句 中 的 
一 个 谓词 将 消耗 结果 集 的 多 少 目 分 比 。 

e num quantiles( 分 位 数 ): RUNSTATS 实用 工具 使 用 分 位 数 来 控制 为 列 数据 捕获 多 
少 分 位 。 增 加 分 位 数 将 给 予 DB2 关于 数据 库 中 数据 分 布 情况 的 更 多 信息 。 

e dbheap( 数 据 库 堆 ): 数据 库 堆 控制 数据 库 对 象 信息 的 可 用 内 存量 。 对 象 包括 索引 、 
缓冲 池 和 表 空 间 。 事 件 监控 器 和 日 志 缓冲 区 信息 也 存储 在 这 里 。 

e cpuspeed (CPU 速度 ): 计算 机 的 CPU 速度 。 

e buffpage 和 缓冲 池 大 小 : 优化 器 可 在 优化 数据 中 使 用 的 缓冲 池 大 小 。 增 加 或 减少 
缓冲 池 大 小 会 对 访问 计划 产生 显著 影响 。 


7.8.4 ”选择 合适 的 优化 级 别 


对 于 混合 的 OLTP/OLAP, 使 用 5 或 3 作为 默认 值 ; 对 于 OLTP, 使 用 更 低 的 级 别 ; 而 
对 于 OLAP， 则 使 用 更 高 的 级 别 。 对 于 简单 的 SELECT 或 短 的 运行 时 查询 (通常 只 需 花 不 到 
1s 就 可 以 完成 ), 使 用 1 或 0 也许 比较 合适 。 如 果 有 很 多 的 表 , 有 很 多 相同 列 上 的 连接 谓词 ， 
那么 尝试 级 别 1 或 2。 对 于 超过 30 秒 才 能 完成 的 长 时 间 运 行 的 得 询 ， 或 者 要 搬入 UNION 
ALL VIEW( 这 是 在 DB2 V8 FP4 中 加 进来 的 )， 可 以 尝试 使 用 级 别 7。 在 大 多 数 环 境 下 都 应 
该 避免 使 用 级 别 9。 一 定 要 根据 自己 的 业务 类 型 和 特点 来 选择 合适 的 优化 级 别 。 


7.8.5 合理 的 存储 |/O 设计 
优化 器 在 工作 时 ， 需 要 读 取 相关 硬件 信息 ， 这 些 信息 是 通过 表 空 间 的 transrate 和 
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overhead 两 个 参数 体现 的 。 


transrate=(1/ 传 送 速 率 )*1000/1024000*4096( 假 设 用 4KB 页 大 小 ) 
overhead= 平 均 寻 道 时 间 +(((1/ 磁 盘 转 速 )*60*1000)/2) 


而 平均 寻 着 时间、 磁盘 旋转 速度 和 传送 速率 是 由 使 盘 本 身 决 定 的 。 
所 以 我 们 必须 做 合理 的 存储 VO 设计 和 选择 转速 更 快 的 硬盘 以 使 优化 套 更 好 地 工作 。 


7.8.6 ” 民 好 的 应 用 程序 设计 和 编码 


在 DB2 数据 库 的 应 用 开发 中 ， 主 要 执行 的 SQL 语句 有 INSERT、UPDATE、DELETE 
和 SELECT 语句 。 其 中 DML 操作 (INSERT、UPDATE 和 DELETE) 不 需要 返回 结果 ， 所 以 
处 理 起 来 相对 比较 简单 。 而 SELECT 语句 需要 返回 结果 ， 在 处 理 的 时 候 相 对 比较 复杂 。 优 
化 器 在 处 理 SELECT 语句 时 ， 通 常 假定 应 用 程序 必须 检索 由 SELECT 语句 指定 的 所 有 行 。 
此 假设 最 适合 于 OLTP 和 批 处 理 环境 。 但 是 ， 在 “浏览 ”应 用 程序 中 ， 查 询 经 党 定义 一 个 
可 能 很 大 的 结果 集 ， 但 它们 只 检索 前 几 行 ， 通 各 只 检索 填 满 该 屏 医 所 需 的 那么 多 行 。 

要 提高 这 种 应 用 程序 的 性 能 ， 可 以 按 下 列 方式 修改 SELECT 语句 来 影响 优化 需 的 优化 
使 用 FOR UPDATE 子 句 来 指定 可 由 后 续 定 位 的 UPDATE 语句 更 新 的 列 。 
使 用 FOR READ/FETCH ONLY 子 句 来 使 返回 的 列 为 只 读 的 。 
使 用 OPTIMIZE FOR n ROWS 子 句 来 给 予 检 过 整个 结果 集中 前 n 行 的 优先 级 。 
使 用 FETCH FIRST n ROWS ONLY 子 句 来 仅 检 索 指 定 的 几 行 。 
使 用 DECLARE CURSOR WITH HOLD 语句 来 每 次 检索 一 行 。 

如 果 使 用 FOR UPDATE、FETCH FIRST n ROWS ONLY 或 OPTIMIZE FOR n ROWS 
于 句 ， 或 者 如 果 声 明 游 标 为 “ 深 动 "那么 会 影响 行 分 块 (BLOCKING)。 

下 面 描述 每 个 方法 的 性 能 优点 。 


FOR UPDATE 子 句 

FOR UPDATE 子 句 通过 仅 包 含 可 由 后 续 定 位 的 UPDATE 语句 更 新 的 列 来 限制 结果 集 。 
如 果 不 带 列 名 指定 FOR UPDATE 子 句 ， 那 么 包括 表 或 视图 的 全 部 可 更 新 列 。 如 果 指 定 列 
名 ， 那 么 每 个 名 称 必 须 是 非 限 定 的 ， 并 且 必 须 标 识 表 或 视图 的 某 一 列 。 

在 下 列 情况 下 ， 不 能 使 用 FOR UPDATE 子 句 : 

e 个 能 删除 与 SELECT 语句 关联 的 游标 。 

e 选择 的 列 中 至 少 有 一 列 是 系统 目录 表 的 不 可 更 新 列 ， 并 且 没 有 在 FOR UPDATE 子 

人 名 中 排除 掉 。 
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FOR READ 或 FETCH ONLY 子 铝 

FOR READ ONLY 子 句 或 FOR FETCH ONLY 子 句 确保 返回 只 读 结 果 。 因 为 被 定义 为 
只 读 的 视图 上 SELECT 的 结果 表 也 是 只 读 的 ， 所 以 允许 此 子 句 但 没有 作用 。 

对 于 允许 更 新 和 删除 的 结果 表 ， 如 末 数 据 库 管 理 器 可 以 检索 数据 块 而 不 是 互 斥 锁定 ， 
那么 指定 FOR READ ONLY 可 能 会 提高 FETCH 操作 的 性 能 。 不 要 对 用 于 定位 的 UPDATE 
或 DELETE 语句 的 得 询 使 用 FOR READ ONLY 子 句 。 


OPTIMIZE FOR n ROWS 子 名 

OPTIMIZE FOR 子 句 声明 只 想 检 索 结 果 的 子 集 或 优先 检索 前 几 行 。 优 化 器 然后 可 以 优 
先 选 择 把 检索 前 几 行 的 啊 应 时 间 减 至 最 短 的 访问 方案 。 另 外 ， 作 为 单个 块 发 送 到 客户 机 的 
行 数 由 OPTIMIZE FOR 子 句 中 的 n 值 来 限制 。 因此 , OPTIMIZE FOR 子 句 既 影响 服务 器 从 
数据 库 检 索 合 格 行 的 方式 ， 叉 影响 将 合格 行 返 回 到 客户 机 的 方式 。 

例如 ， 假 设 定期 查询 职员 表 ， 查 找 具 有 最 高 工资 的 职员 : 

SELECT LASTNAME, FITIRSTNAME, EMPNO, SALARY 

FROM EMPLOYEE ORDER BY SALARY DESC 


定义 了 一 个 基于 SALARY 列 的 降序 索引 。 但 是 ， 由 于 职员 是 按 职 员 号 排序 的 ,因此 工 
资 索引 可 能 很 难 集群 。 为 了 尽量 避免 许多 随机 的 同步 IO， 优 化 堪 将 可 能 选择 使 用 列表 预 
取 访 问 方法 ， 此 方法 需要 对 合格 的 所 有 行 的 行 标识 排序 。 在 将 前 几 个 合格 行 返 回 至 应 用 程 
序 亲 ， 此 排序 可 能 导致 一 个 延迟 。 要 防止 此 延 民 ， 癌 语句 添加 OPTIMIZE FOR 子 句 ， 如 下 
所 不 : 

SELECT LASTNAME, FIRSTNAME, EMPNO, SALARY FROM EMPLOYEE 

ORDER BY SALARY DESC OPTIMIZE FOR 20 ROWS 


在 此 情况 下 ， 优 化 器 可 能 选择 直接 使 用 SALARY 索引 ， 因 为 只 检索 具有 最 高 工资 的 
20 个 职员 。 不 管 可 以 将 多 少 行 分 块 ， 将 只 把 由 每 20 行 组 成 的 块 返回 至 客户 机 。 

使 用 OPTIMIZE FOR 子 句 ， 优 化 器 优先 选择 可 以 避免 大 量 操作 或 中 断 行 流动 (如 排序 ) 
的 访问 方案 。 使 用 OPTIMIZE FOR 1 ROW 最 有 可 能 影 啊 访 问 路 径 。 使 用 此 子 句 可 以 有 下 
列 作用 : 

e 与 组 合 内 部 表 的 连接 顺序 不 太 可 能 ， 因 为 它们 需要 临时 表 。 

e 连接 方法 可 以 更 改 。 骸 套 循 环 连接 是 非常 可 能 的 选择 ， 因 为 它 共 有 低 开 销 成 本 ， 

并 且 通 名 在 检索 少量 行 时 更 有 效率 。 
e 与 ORDER BY 子 句 匹 配 的 索引 更 可 能 ， 因 为 对 于 ORDER BY 不 需要 排序 。 
e 列表 预 取 不 太 可 能 ， 因 为 此 访问 方法 需要 排序 。 
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e 顺序 预 取 不 太 可 能 ， 因 为 知道 只 需要 少量 的 几 行 。 
e 在 连接 得 询 中 ， 在 ORDER BY 子 句 中 包含 列 的 表 可 能 选 作 外 部 表 ， 前 提 是 该 外 部 
表 上 的 索引 提供 ORDER BY 子 句 所 需 的 排序 。 

虽然 OPTIMIZE FOR 子 句 适用 于 所 有 优化 级 别 , 但 它 在 优化 级 别 3 和 更 高 级 别 下 工作 
得 最 好 ， 因 为 级 别 3 以 下 的 级 别 使 用 贫 禁 连接 枚 举 方 法 。 此 方法 有 时 会 产生 不 能 使 它们 目 
己 很 快 检索 前 儿 行 的 多 表 连 接 的 访问 方案 。 

OPTIMIZE FOR 子 句 不 阻止 检索 全 部 合格 行 。 如 果 确 实 要 检索 全 部 合格 行 ， 那 么 总 耗 
用 时 间 可 能 大 大 高 于 优化 器 为 整个 答案 集 进 行 优 化 押 需 的 时 间 。 

如 果 已 打包 的 应 用 程序 使 用 调用 级 接口 (DB2 CLI 或 ODBC)， 可 在 DB2CLLINI 配置 
文件 中 使 用 OPTIMIZEFORNROWS 关键 宁 , 让 DB2 CLI 目 动 将 OPTIMIZE FOR 子 句 退 加 
至 每 条 查询 语句 的 末尾 。 

如 果 同 时 指定 了 FETCH FIRST 子 句 和 OPTIMIZE FOR 子 句 ， 那 么 这 两 个 值 中 较 小 的 
那个 影响 通信 绥 冲 区 大 小 。 为 了 达到 最 优化 ， 将 这 两 个 值 看 作 互 不 相关 的 。 


FETCH FIRST n ROWS ONLY 子 句 

FETCH FIRST n ROWS ONLY 子 句 设置 可 检索 的 最 大 行 数 。 将 结果 表 限 制 为 只 包含 前 
儿 行 可 提高 性 能 。 无 论 结果 集 可 能 男 外 包含 多 少 行 ， 只 检索 n 行 。 

如 果 同 时 指定 了 FETCH FIRST 子 句 和 OPTIMIZE FOR 子 句 ， 那 么 这 两 个 值 中 较 小 的 
那个 影响 通信 绥 冲 区 大 小 。 为 了 达到 优化 目的 ， 这 两 个 值 是 互相 独立 的 。 


DECLARE CURSOR WITH HOLD 语句 

当 用 包括 WITH HOLD 子 句 的 DECLARE CURSOR 语句 声明 游标 时 ,在 提交 该 事务 时 
任何 打开 的 游标 仍然 打开 ; 并 且 释 放 押 有 锁定 ， 除 保护 打开 的 WITH HOLD 游标 的 当前 游 
标 位 置 的 锁定 外 。 如 果 回 滚 事务 , 那么 关闭 所 有 打开 的 游标 且 释 放 所 有 锁定 以 及 释放 LOB 
定位 器 。 

可 将 DB2 CLI 连接 属性 SQL_ATTR CURSOR HOLD 用 于 CLI 应 用 程序 以 实现 同样 
的 结果 。 如 果 有 使 用 调用 级 接口 (DB2 CLI 或 ODBO) 的 已 打包 的 应 用 程序 ， 那 么 在 
DB2CLIINI 配置 文件 中 使 用 CURSORHOLD 关键 字 ， 让 DB2 CLI 自动 为 每 个 已 声明 游标 
假设 WITH HOLD 子 句 。 


7.9 本草 小 结 


本 章 我 们 讨论 了 DB2 数据 库 处 理 数据 的 核心 引擎 一 一 DB2 优化 右 的 功能 、 工 作 原 理 
以 及 如 何 使 其 最 有 效 地 工作 。 优 化 胡 是 数据 库 浓 理 系 统 中 产生 执行 计划 的 组 件 ， 本 革 主 要 
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介绍 了 DB2 优化 堪 的 工作 诛 理 ， 解 谈 了 执行 计划 中 第 见 的 操作 以 及 它们 的 性 能 优 劣 ， 如 索 
引 扫 朱 、 全 夫 扫 摘 、 合 并 连接 、 秽 和 父 循 环 连 接 、 哈 和 硕 连 接 等 。 本 章 还 介绍 了 对 于 不 同 的 优 
化 级 别 DB2 采用 的 优化 算法 上 面 的 差别 ， 以 及 与 Oracle 类 似 的 基于 规则 的 优化 概要 文件 。 
和 草 还 融 如 何 影响 优化 规 以 产生 我 们 期 吾 的 执行 计划 给 出 了 一 些 建议 ， 如 蝎 新 统计 信息 、 
构建 索引 、 修 改 配 置 参 数 等 。 竺 握 了 这 些 知识 之 后 ， 我 们 就 能 够 在 设计 配置 数据 库 及 应 用 
开 友 的 时 候 得 心 应 手 了 。 


统计 信息 更 新 与 伴 片 整理 


统计 信息 是 DB2 收集 的 关于 数据 库 中 表 和 索引 等 对 象 的 相关 信息 , 这 些 信息 在 收集 之 
后 被 保存 在 数据 库 系统 编目 表 中 ， 当 应 用 程序 或 SQL 语句 访问 数据 时 , 优化 器 需要 根据 这 
些 统计 信息 来 生成 成 本 最 低 的 访问 计划 。 只 有 准确 的 统计 信息 才能 让 DB2 数据 库 产生 最 优 
的 数据 访问 计划 ， 进 而 进行 融 效 的 数据 访问 。 相 反 ， 如 果 数 据 库 中 只 有 过 时 的 、 不 准确 的 
统计 信息 ， 甚 全 没有 相关 的 统计 信息 ， 那 么 数据 的 高 效 访问 束 无 从 谈 起 。 所 以 统计 信息 的 
准确 与 否 束 显得 非常 重要 ，。 

随 独 数据 的 不 断 删 除 、 插 入 和 更 新 ， 数 据 页 和 索引 页 会 变 得 越 来 越 地 敢 ， 数 据 页 和 家 
引 页 的 物理 存储 顺序 不 再 匹配 其 锡 辑 顺序 ， 款 引 结构 的 层次 会 变 得 过 大 ， 这 些 者 会 寻 致 数 


据 页 和 索引 页 的 读 取 变 得 效率 低下 。 因 此 ， 需 要 根据 数据 更 新 的 频繁 程度 适当 地 重新 组 织 
表 和 有 索引。 


统计 信息 更 新 和 表 、 索 引 雄 片 整 理 是 DBA 经 党 要 做 的 例 行 工 作 ， 在 本 章 中 我 们 给 
e 统计 信息 更 新 

目 动 统计 信息 更 新 

表 、 索 引 俱 户 整 理 

重新 绑 定 应 用 程序 包 
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8.1 统计 信息 更 新 


8.1.1 统计 信息 的 重要 性 


DB2 优化 占 是 DB2 的 “大 脑 ”。 而 DB2 优化 占 依 徘 存 放 在 系统 目录 表 空 间 中 的 数据 库 
统计 信息 才能 做 出 正确 的 判断 ， 佑 算出 茶 个 特定 得 询 的 所 有 访问 路 径 的 成 本 。 随 后 ，DB2 
优化 堪 会 选择 成 本 最 低 的 访问 路 径 来 获取 数据 。 您 可 能 会 问 ， 成 本 究竟 表示 什么 呢 ? 成 本 
表示 DB2 优化 右 对 执行 语句 所 用 时 间 的 最 优 人 和 估计。 在 这 里 您 需要 注意 , 最 音 见 的 合 询 操作 
是 SELECT 语句 ,而 DML( 比 如 UPDATE) 或 DDL( 比 如 索引 重建 ) 也 会 执行 查询 操作 ， 这 同 
样 需 要 通过 基于 成 本 的 DB2 优化 器 来 进行 分 析 。 

数据 库 统计 信息 中 的 变化 会 影响 DB2 优化 堪 对 获取 目标 数据 的 访问 路 径 成 本 的 估算 ， 
从 而 可 能 选择 不 同 的 访问 路 答 。 因 此 ， 如 果 数 据 库 统计 信息 误差 过 大 ， 束 有 可 能 造成 性 能 
问题 。 

例如 : 一 张 有 100 万 行 数据 的 表 ， 数 据 库 统 计 信 息 却 记录 这 个 表 只 有 一 行 数据 ， 那 么 
DB2 根据 统计 信息 就 有 可 能 选择 全 表 扫 描 而 不 是 索引 去 获取 数据 。 

下 面 列 举 了 统计 信息 收集 的 一 些 信息 ， 这 些 信息 可 以 帮助 DB2 优化 器 选择 最 优 访 
问 策 上 略 : 

表 中 的 页 数 和 非 空 的 页 数 。 

表 中 发 生 行 链接 (overflow) 的 数量 。 

表 中 的 行 数 。 

有 关 单 个 列 的 统计 信息 ， 比 如 一 列 中 唯一 值 的 数量 。 

索引 的 聚合 程度 ， 即 表 中 数据 的 存储 顺序 与 茶 索 引 字 段 顺序 的 符合 程度 。 
有 关 索 引 的 统计 信息 ， 比 如 系 引 级 别 的 数量 和 每 个 索引 中 叶子 页 的 数量 。 
经 名 使 用 的 列 值 的 出 现 次 数 。 

列 值 在 列 所 有 值 中 的 分 布 状况 。 

用 户 定 制 函数 (UDF) 的 成 本 估计 。 

除 以 上 信息 外 ，DB2 还 可 以 收集 下 列 信息 : 索引 的 聚合 程度 、 索 引 中 叶子 页 数目 、 洲 
出 其 原始 页 的 表 行 数 ， 以 及 表 中 已 填充 的 页 数 和 衬 页 数 。DBA 可 以 参考 这 些 信息 来 决定 何 
时 重组 表 和 索引 。 

DB2 数据 库 不 可 能 在 每 次 数据 库 谎 加 、 删 除 、 修 改 数 据 后 都 更 新 数据 库 统计 信息 ， 这 
是 因为 过 于 频 素 地 更 新 统计 信息 有 可 能 造成 系统 性 能 的 巨大 开销 : 此外， 如 果 修 改 的 数据 
数量 有 限 , 那么 有 可 能 统计 信息 的 一 些微 误差 不 会 造成 DB2 选择 成 本 高 昂 的 访问 路 径 ， 这 
时 也 没有 必要 频繁 更 新 数据 库 统计 信息 。 出 于 上 述 两 点 原因 ，DB2 数据 库 中 的 统计 信息 并 
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不 是 动态 更 新 的 。 不 过 ，DB2 提供 了 RUNSTATS 命令 来 手工 更 新 数据 库 统 计 信 息 。 当 用 
户 表 中 对 大 量 数 据 修改 后 ， 用 户 可 以 考虑 在 表 和 索引 上 执行 RUNSTATS 命令 ， 用 最 新 的 
信息 更 新 系统 目录 表 中 的 统计 信息 。 

在 成 功 执行 RUNSTATS 命令 之 后 , 静态 SQL 租 询 并 不 会 使 用 最 新 的 数据 库 统 计 信 息 ， 
这 是 因为 静态 SQL 的 访问 策略 在 之 前 执行 BIND 时 就 已 确定 , 而 当时 使 用 的 统计 信息 有 可 
能 与 现在 的 并 人 不一致。 这 时 候 了 驶 需要 重新 绑 定 使 用 静态 SQL 的 应 用 程序 ， 这 样 租 询 优化 
售 束 可 以 根据 数据 库 的 最 新 统计 信息 来 选择 获取 数据 的 最 佳 访问 策略 。 但 是 ， 对 于 使 用 动 
态 SQL 的 应 用 程序 而 言 ， 没 必要 进行 重新 绑 定 ， 因 为 动态 SQL 语句 的 访问 策略 是 根据 统 
计 信 息 在 运行 时 动态 生成 的 。 

现在 , 几乎 所 有 主流 数据 库 都 使 用 某 种 方法 (在 Oracle 数据 库 中 调用 dbms stats 存储 过 
程 ， 在 Informix 数据 库 中 用 update statistics; 在 Sybase 数据库 中 用 update statistics) 来 更 新 
系统 目录 统计 信息 ,以便 为 优化 占 提 供 可 能 的 最 佳 信息 ,您 可 以 将 优化 右 想 象 成 汽车 的 GPS 
定位 仪 ， 它 能 够 在 由 系统 数据 组 成 的 磊磊 深山 里 作 行驶 路 任 选 择 。 日 录 统 计 信 息 的 更 新 将 
为 优化 右 提 供 最 新、 最 准确 的 地 图 信息 ， 以 便 能 够 获取 最 佳 行驶 路 人 径 。 


8.1.2 如何 更 新 统计 信息 


只 有 当 进 行 显 式 请 求 时 ， 对 象 的 统计 信息 才 会 在 系统 目录 表 中 被 更 新 。 有 以 下 儿 种 方 
法 可 以 更 新 部 分 或 全 部 统计 信息 : 

e 使 用 RUNSTATS( 运 行 统计 信息 ，run statistics) 命 令 。 

e 使 用 市 有 指定 的 统计 信息 收集 选项 的 LOAD。 

e 对 针对 一 组 预先 定义 的 系统 目录 视图 进行 操作 的 SQL UPDATE 语句 进行 编码 。 

e 使 用 “reorgchk update statistics ”命令 。 

当 您 不 完全 知道 所 有 表 名 或 表 名 实在 太 多 而 无 法 对 每 张 表 逐 个 更 新 策略 时 ， 进 行 
RUNSTATS 的 最 人 徇 单 方法 束 是 使 用 “db2 reorgchk update statistics ”命令 。 脚 本 如 下 : 


doz -Vv CONnect to sample 

db2 -V "select tbname, nleaf, nlevels, stats 七 Ime from sysibm.sysindexes" 
db2 -Vv reorgchk update statistics on table all 

db2 -Vv "select tbname, nleaf, nlevels, stats time from sysibm.sysindexes" 
db2 -V terminate 


我 们 上 面 所 选 的 示例 不 需要 表 名 。 这 一 命令 对 所 有 表 执 行 RUNSTATS 命令 。 


记 住 ; 
在 批量 数据 加 载 后 要 运行 RUNSTATS 命令 ， 
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如 果 知 道 表 名 并 且 想 避免 对 大 量 表 执行 RUNSTATS 命令 (因为 这 样 做 可 能 要 花 很 长 时 
间 )， 那 么 一 次 对 一 张 表 进行 RUNSTATS 更 为 可 取 。 脚 本 如 下 : 


db2 -VY runstats on table tabschema .tabname and indexes all 
这 个 命令 将 收集 该 表 及 其 所 有 索引 (基本 级 别 ) 的 统计 信息 。 


查看 是 否 执行 了 RUNSTATS 命令 
要 查看 是 否 对 数据 库 执 行 了 RUNSTATS 命令 ， 一 种 快捷 方法 便 是 查询 一 些 系 统 目录 
表 。 例 如 ， 对 于 上 面 的 脚本 ， 可 以 执行 下 面 这 条 命令 : 


db velect thnam nlcat, nleovels tats time from oysibm svo nexes 


如 果 还 未 执行 过 RUNSTATS 命令 ， 您 会 看 到 nleaf 和 nlevels 列 为 “-1” 且 stats time 
列 为 “-”。 如 果 已 经 执行 了 RUNSTATS 命令 ， 这 些 列 将 包含 实际 的 数字 ， 并 且 stats_time 
列 将 会 包含 时 间 惟 记 。 如 果 您 认为 stats time 列 显示 的 时 间距 离 现 在 过 久 ， 就 需要 再 次 执 
行 RUNSTATS 命令 。 

可 以 查询 系统 目录 表 中 的 以 下 列 ， 以 确定 是 合 在 表 和 索引 上 执行 了 RUNSTATS 命令 : 

e 如 果 对 于 某 个 表 ，SYSCAT.TABLES 视图 的 CARD 列 显示 的 值 为 - 1， 或 者 

stats time 列 显 示 的 值 为 NULL， 那 么 表示 没有 对 该 表 执 行 过 RUNSTATS 命令 。 

e 如 果 对 于 某 个 过 引 ，SYSCAT.INDEXES 视图 的 nleaf、nlevels 和 fullkeycard 列 显 

示 的 值 为 -1， 或 者 stats time 列 显示 的 值 为 NULL， 那 么 表示 还 没有 对 该 索引 执 
行 过 RUNSTATS 命令 。 

在 表 上 执行 RUNSTATS 命令 时 ， 可 以 有 两 种 用 户 访 问 选项 : 允许 谈 访 问 (ALLOW 
READ ACCESS) 和 人 允许 写 访 问 (ALLOW WRITE ACCESS)。 

在 执行 RUNSTATS 命令 时 ， 如 果 加 上 ALLOW READ ACCESS 选项 ， 那 么 其 他 用 户 
只 能 够 以 只 读 的 方式 访问 该 表 ， 这 个 选项 会 影响 应 用 的 并 行 性 ， 因 为 任何 想 要 更 改 表 的 操 
作 这 时 都 会 处 于 等 待 状态。 可 以 选择 在 使 用 ALLOW READ ACCESS 选项 时 ， 同 时 使 用 
TABLESAMPLE 选项 ， 加 上 这 个 选项 后 只 收集 表 的 部 分 采样 数据 而 不 是 所 有 数据 。 如 果 能 
合理 选择 采样 数据 大 小 ， 那 么 就 可 以 在 确保 统计 信息 一 致 性 的 情况 下 ， 加 快 RUNSTATS 
的 速度 。 

在 执行 RUNSTATS 命令 时 ， 如 果 加 上 ALLOW WRITE ACCESS 选项 ， 那 么 其 他 用 户 
可 以 读 取 或 写 入 该 表 。 默认 情 况 下 , RUNSTATS 命令 使 用 的 是 ALLOW WRITE ACCESS 
选项 。 
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分 区 数据 库 中 的 RUNSTATS 

在 分 区 数据 库 环 境 中 收集 某 个 表 的 统计 信息 时 ，RUNSTATS 将 只 对 从 其 中 执行 该 实 
用 程序 的 数据 库 分 区 执行 操作 。 在 此 数据 库 分 区 中 获得 的 结果 将 被 推广 到 其 他 数据 库 分 区 。 
如 果 此 数据 库 分 区 未 包含 该 表 的 所 需 部 分 ， 那 么 该 请 求 将 被 发 送 到 数据 库 分 区 组 中 第 一 个 
包 侣 所 需 数 据 的 数据 库 分 区 。 

8.1.3 统计 信息 更 新 示例 

下 面 举 一 些 例 子 来 说 明 如 何 使 用 RUNSTATS 收集 统计 信息 。 

注意 : 

在 RUNSTATS 语法 中 ， 必 须 使 用 全 限定 的 表 名 schema.table-name 和 全 限定 的 索引 名 
schema.index-name。 您 可 以 在 所 有 列 上 ,或 者 仅仅 在 某 些 列 或 列 组 (除了 LONG 和 LOB 列 ) 
上 执行 RUNSTATS。 如 果 没 有 指定 特定 列 的 子 句 ， 那 么 系统 会 使 用 默认 的 ON ALL 
COLUMNS 子 句 ， 

例 8-1 收集 所 有 列 上 的 数据 库 统 计 信 息 。 

RUNSTATS ON TABLE db2inst1.account ON ALL COLUMNS 

这 等 同 于 : 

RUNSTATS ON TABLE db21nst1.account 

例 8-2 ”收集 单个 列 上 的 数据 库 统 计 信 息 。 

RUNSTATS ON TABLE ab21nst1l1 account ON COLUMNS {acctno, acctname) 


例 8-3 展示 如 何 收 集 key column( 关 键 列 ) 上 的 统计 信息 。 短 语 “key column” 表 示 构 
成 表 上 所 定义 肥 引 的 列 。 如 果 没 有 索引 存在 ， 这 条 命令 不 会 收集 任何 列 的 统计 信息 。 


RUNSTATS ON TABLE db2instl.account ON KEY COLUMNS 

例 8-4 ”收集 关键 列 上 和 非 关 键 列 上 的 数据 库 统 计 信 息 。 

RUNSTATS ON TABLE db21instli.account ON KEY COLUMNS AND COLUMNS (acctname) 
例 8-$ ”收集 表 和 索引 上 的 数据 库 统 计 信息 ， 不 包含 分 布 统计 信息 。 

RUNSTATS ON TABLE db2instl.account AND INDEXES ALL 


例 8-6 收集 表 上 的 数据 库 统 计 信 息 以 及 索引 上 的 详细 统计 信息 ， 不 包含 分 布 统计 
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| 丘 
RUNSTATS ON TABLE db21nstl.account AND DETAILED INDEXES ALL 
例 8-7 只 收集 3 个 指定 索引 上 的 数据 库 统 计 信 息 ( 不 收集 表 统 计 信 息 )。 


RUNSTATS ON TABLE db2instl.account FOR INDEXES db2inst]l.INX], 
db21inst1.INX2, db2inst1l.INX3 


例 8-8 只 收集 所 有 索引 上 的 数据 库 统计 信息 。 
RUNSTATS ON TABLE db2inst1.account FOR INDEXES ALL 


如 果 创 建 了 新 的 索引 ， 而 在 最 后 一 次 执行 RUNSTATS 以 后 还 未 修改 相应 的 表 ， 那 么 
您 可 以 只 收集 索引 上 的 数据 库 统计 信息 。 在 创建 索引 时 ， 还 可 以 收集 数据 库 统 计 信息 。 


包含 统计 信息 配置 文件 的 RUNSTATS 

现在 ， 可 以 为 RUNSTATS 建立 统计 信息 配置 文件 。 统 计 信 息 配 置 文件 是 指 一 组 选项 ， 
它 预先 定义 了 特定 表 上 将 要 收集 的 统计 信息 。 

当 将 命令 参数 “SET PROFILE” 添 加 到 RUNSTATS 命令 时 ， 将 在 表 描 述 符 和 系统 目 
录 中 注册 或 存储 统计 信息 配置 文件 。 如 果 要 更 新 统计 信息 配置 文件 ， 那 么 可 以 使 用 命令 参 
数 “UPDATE PROFILE”。DB2 中 没有 删除 配置 文件 的 选项 。 

那么 这 个 配置 文件 有 什么 用 途 呢 ? 

e LOAD 操作 的 时 候 使 用 选项 STATISTICS USE PROFILE 来 收集 统计 信息 。 

e PROFILE 的 RUNSTATS 选项 作为 AUTO RUNSTATS 的 操作 选项 ， 关 于 AUTO 

RUNSTATS 见 8.2 节 。 
下 和 面 的 例子 展示 了 如 何 使 用 这 项 功能 : 
例 8-9 只 注册 统计 信息 配置 文件 ， 不 收集 数据 库 统计 信息 。 


RUNSTATS ON TABLE db2instl1.account AND INDEXES ALL SET PROFILE ONLY 

RUNSTATS 中 的 子 句 “SET PROFILE ONLY” 指 定 不 收集 统计 信息 。 

例 8-10 注册 统计 信息 配置 文件 ， 并 执行 所 存储 统计 信息 配置 文件 的 RUNSTATS 命 
令 选 项 来 收集 目录 统计 信息 。 

RUNSTATS ON TABLE aqb21nstl1 account AND INDEXES ALI，SET PROFILE 

例 8-11 仪 修改 现 有 的 统计 信息 配置 文件 ， 不 收集 任何 数据 库 统 计 信 息 。 


RUNSTATS ON TABLE db2instl.account WITH DISTRIBUTION AND INDEXES ALL UPDATE 
PROFILE OQNLY 
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例 8-12 ”修改 现 有 的 统计 信息 配置 文件 , 并 执行 已 更 新 的 统计 信息 配置 文件 的 RUNSTATS 
命令 选项 来 收集 数据 库 统计 信息 。 


RUNSTATS ON TABLE db2instl.account WITH DISTRIBUTION AND INDEXES ALL UPDATE 
PROF TLE 


例 8-13 根据 前 面 已 注册 的 统计 信息 配置 文件 来 合 询 RUNSTATS 选项 。 


SELECT STATISTICS PROFILE FROM SYSIBM.SYSTABLES WHERE NAME = "DEPARTMENT' 
AND CREATOR = "DB2INSTL 


例 8-14 ”使 用 前 和 面 已 注册 的 统计 信息 配置 文件 收集 数据 库 统计 信息 。 
RUNSTATS ON TABLE db2instl.account USE PROFILE 


带 抽 样 的 RUNSTATS 

随 着 数据 库 不 断 地 快速 增长 ， 由 于 时 间 窗 口 、 内 存 和 CPU 等 约束 的 限制 , 通过 全 表 扫 
摘 来 收集 数据 库 统 计 信 息 将 会 变 得 越 来 越 困 难 。 这 时 候 可 以 考虑 通过 数据 抽样 ， 即 只 扫描 
表 的 数据 子 集 来 收集 数据 库 统计 信息 。 

如 果 查 询 试 图 预计 总 的 趋势 和 模式 ， 并 且 某 一 误差 域 (margin of error) 内 的 近似 答案 中 
以 监 出 这 些 趋势 和 模式 ， 那 么 数据 抽样 或 许 是 比 全 表 扫 摘 更 好 的 选择 。 

使 用 SAMPLED DETAILED 子 句 , 这 将 通过 对 索引 数据 抽样 来 计算 详细 的 索引 统计 信 
县 。 该 子 句 的 使 用 将 减少 为 获得 详细 索引 统计 信息 而 执行 的 后 台 计 算 量 和 所 需 的 时 间 ， 并 
日 在 大 多 数 情况 下 ， 部 会 使 数据 足够 精确 。 

注意 : 

在 DB2 V9 中 ，RUNSTATS 命令 并 不 支持 显 式 指定 索引 采样 率 。 在 DB2 V10 以 及 之 
后 的 版 本 中 ， 在 RUNSTATS 命令 行 中 可 以 显 式 指定 索引 的 采样 率 : 

Index Sampling Options 

| INDEXSAMPLE + RERMOUELI + {nmeric litoral 1 

'—SYSTEM-————' 

以 下 是 一 些 使 用 该 子 句 的 例子 。 

例 8-15 收集 两 个 索引 上 的 详细 数据 库 统 计 信 息 ， 但 对 每 个 索引 条 目 使 用 抽样 来 代替 
执行 详细 的 计算 。 

RUNSTATS ON TABLE db2inst1.account AND SAMPLED DETAILED INDEXES ALL 


例 8-16 ”收集 索引 上 的 详细 抽样 统计 信息 和 表 的 分 布 统计 信息 。 
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RUNSTATS ON TABLE qb21nst1.account WITH DISTRIBUTION ON KEY 
COLUMNS AND SAMPLED DETAITLED INDEXES ALL 


DB2 提供 了 对 表 数 据 进 行 抽样 的 两 种 方法 : 行 级 的 贝 努 里 (Bernoulii) 抽 样 和 系统 页 级 
的 抽样 ， 这 两 种 方法 都 可 以 在 命令 行 中 显 式 指定 采样 率 。 

Table Sampling Options 

| TABLESAMELDE TT BEBNOULLT [Tnerie TIEeEreaE J > 


Th 


带 系 统 页 级 抽样 的 RUNSTATS 

系统 由 级 抽样 与 行 级 抽样 类 似 ， 只 是 抽样 的 对 象 是 页 和 面 而 个 是 行 。 以 P/100 的 概率 选 
择 每 一 员 ， 而 以 1 - P/100 的 概率 拒绝 页 的 选择 。 在 所 选中 的 每 一 页 中 ， 要 选择 所 有 的 行 。 
系统 页 级 抽样 优 于 全 表 扫 描 或 贝 努 里 (Bernoulli) 抽 样 的 地 方 是 节省 了 LO。 

抽样 页 也 是 预 取 的 , 所 以 该 方法 将 比 行 级 贝 努 里 (Bernoulli) 抽 样 更 快 。 与 不 进行 抽样 相 
比 ， 页 级 抽样 极 大 地 提高 了 性 能 。 

RUNSTATS REPEATABLE 子 句 允许 通过 RUNSTATS 语句 生成 相同 的 样本 ， 只 要 表 
数据 没有 发 生 更 改 。 为 了 指定 该 选项 ， 用 户 还 必须 提供 一 个 整数 ， 以 表示 将 用 于 生成 样本 
的 种 子 (seed)。 通 过 使 用 相同 的 种 和子， 可 以 生成 相同 的 样本 。 

总 之 ， 统 计 信 息 的 准确 性 取决 于 抽样 鞭 、 数 据 倾 斜 (data skew) 以 及 用 于 数据 抽样 的 数 
据 和 群集 。 

下 面 是 一 些 使 用 贝 努 里 (Bermoulli) 行 级 和 系统 页 级 抽样 的 RUNSTATS 例子 。 

例 8-17 ”收集 统计 信息 ， 包 含 10% 行 上 的 分 布 统计 信息 。 

RUNSTATS ON TABLE qb21nstl .account WITH DISTRIBUTION TABLESAMPLE BERNOULLI (10) 

例 8-18 为 了 控制 收集 统计 信息 的 样本 集 ， 以 及 可 以 重复 使 用 相同 的 样本 集 ， 需 要 使 
用 下 列 语句 : 


RUNSTATS ON TABLE db21nstl.account WITH DISTRIBUTION TABLESAMPLE 
BERNOULLI (10) REPEATABLE (1024) 
例 8-19 收集 10% 的 数据 页 上 的 索引 统计 信息 和 表 统 计 信息 。 请 注意 ， 只 对 表 数 据 页 
进行 抽样 ， 而 不 是 索引 页 。 在 本 例 中 ，10% 的 表 数 据 页 用 于 表 统 计 信息 的 收集 ， 而 对 于 索 
引 统计 信息 ， 将 使 用 所 有 的 索引 页 。 


R6UNSTATS ON TABLE db21nst1.account AND INDEXES ALL TABLESAMPLE SYSTEM (10) 
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8.1.4 LIKE STATISTICS 统计 信息 更 新 
我 们 在 应 用 中 经 常 使 用 类 似 %abc% 的 查询 ， 在 某 些 列 上 指定 LIKE 谓词 : 
SELECT * FROM employee WHERE firstname LIKE ‘'%abcs"' 


当 在 RUNSTATS 中 指定 LIKE STATISTICS 子 句 时 ,将 收集 附加 的 列 统 计 信息 。 查 询 
优化 器 用 它们 来 提高 “column LIKE '%abc'” 和 “column LIKE '"%abc9%' ”类 型 谓词 的 选择 
性 估计 。 它 通常 有 利于 优化 器 了 解 某 些 关 于 列 的 子 元 素 结 构 的 基本 统计 信息 。 这 些 统计 信 
息 存储 在 SYSIBM.SYSCOLUMNS 表 的 SUB DELIM LENGTH 和 SUB COUNT 列 中 。 当 
执行 带 有 LIKE STATISTICS 子 句 的 RUNSTATS 时 ,将 对 类 型 为 CHAR 和 VARCHAR， 并 
日 具有 单字 节 字 符 集 (SBCS) 的 代码 页 属性 FOR BIT DATA 或 UTF-8 的 列 收集 下 列 统 计 信 息 : 

e。 SUB COUNT: 子 元 素 的 平均 数 。 

e。 SUB DELIM LENGTH: 分 隔 每 个 子 元 素 的 每 个 定 界 和 从 的 平均 长 度 。 

下 面 的 例子 说 明了 如 何 使 用 RUNSTATS 收集 包含 LIKE 统计 信息 的 数据 库 统 计 信 息 。 

例 8-20 ”收集 所 有 列 上 的 数据 库 统 计 信 息 并 指定 VARCHAR 列 上 的 LIKE 统计 信息 。 


RUNSTATS ON TABLE db21instl1.account ON ALL COLUMNS and COLUMNS (acctname LIKE 
STATTISTICS) 


DB2_LIKE _ VARCHAR 注册 变量 影 啊 优 化 蕉 处 理 以 下 格式 袁 词 的 方式 : 
COLUMN 工 工 RE “等 又 买 尺 买 入驻 等 “ 


其 中 xxxxxx 代表 任何 学 符 串 , 也 就 是 搜索 值 从 % 和 字符 开始 的 任何 LIKE 谓词 (可 能 以 % 
字符 结束 ， 也 可 能 不 以 该 字符 结束 )。 将 这 些 称 为 “通配符 LIKE 谓词 ”。 对 于 所 有 谓词 ， 
优化 器 必须 估计 有 多 少 行 与 该 谓词 匹配 。 对 于 通配符 LIKE 谓词 ， 优 化 器 假设 要 匹配 的 
COLUMN 包含 并 置 在 一 起 的 一 系列 元 素 ， 并 且 基 于 字符 串 长 度 估计 每 个 元 素 的 长 度 ， 不 
包括 前 导 和 结尾 % 字 符 。 

要 检查 子 元 素 统计 信息 的 值 ， 查 询 SYSIBM.SYSCOLUMNS。 例 如 : 


select substr (NAME,1,16)}, SUB COUNT, SUB DELIM LENGTH from 
sysibm.syscolumns where tbname = "EMPLOYEE'" 


注意 : 

如 果 使 用 了 LIKE STATISTICS 子 扣 ， 那 么 RUNSTATS 可 能 花 较 长 时 间 。 例 如 ， 如 果 
未 使 用 DETAILED 和 DISTRIBUTION 选项 , 那么 RUNSTATS 在 县 有 5 个 字符 列 的 表 上 
运行 时 间 会 增加 15% 到 40%6， 甚 至 更 长 时 间 。 如 果 指 定 DETAILED 或 DISTRIBUTION 选 
项 ， 那 么 相应 也 会 额外 增加 一 些 开 销 。 所 以 我 们 在 应 用 时 一 定 要 评估 给 我 们 带 来 的 性 能 提 
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高 和 相应 延长 的 RUNSTATS 时 间 之 间 的 开销 是 否 相 当 。 通 常 ,如 果 类 似 “select colname from 
t] where colname like '%ABC%'” 这 样 的 SQL 语句 执行 得 非常 频繁 而 且 该 查询 比较 重要 ， 
那么 建议 对 该 列 做 LIKE STATISTICS 统计 信息 更 新 。 


8.1.5 列 组 统计 信息 更 新 


我 们 在 “第 7 间 : DB2 优化 问 ” 中 给 大 家 讲 过 ，DB2 优化 器 在 为 SQL 语句 执行 最 优 
计划 时 ， 成 本 评估 产生 3 种 上 度量 标准 : 
e。 SELECTIVITY: 表示 有 多 少 行 可 以 通过 谓词 被 选择 出 来 ， 大 小 介 于 0.0~1.0，0 表 
示 没 有 行 被 选择 出 来 。 如 果 没 有 统计 信息 ，estimator 会 使 用 默认 的 SELECTIVITY 
值 ， 这 个 值 根据 谓词 的 不 同 而 不 同 。 比 如 = 的 SELECTIVITY 小 于 '<'。 如 果 有 统 
计 人 信息， 比如 对 于 last name = 'Smith'，estimator 使 用 last name 列 的 distinct 值 的 
倒数 (是 指 表 中 所 有 last name 的 distinct 值 ) 作 为 SELECTIVITY 值 。 
e。 CARDINALITY: 表示 行 集 的 行 数 。 
e COST: COST 表现 了 磁盘 IO，CPU usage 资源 单位 的 使 用 成 本 单位 (timeron)。 
列 组 (Column Group) 统 计 信 息 将 获得 一 组 列 的 不 同 值 组 合 的 数 日 。 通 常 ，DB2 优化 器 
可 用 的 基本 统计 信息 不 检测 数据 相关 性 。 列 组 的 使 用 将 给 多 个 谓词 的 联合 选择 提供 更 准确 
的 估计 。 优 化 器 凭借 精确 的 基数 估计 (Estimated Cardinality) 值 来 准确 计算 出 每 一 个 待定 查询 
访问 计划 的 成 本 。 基 数 估计 是 这 样 一 种 过 程 : 在 应 用 了 谓词 或 执行 了 聚集 之 后 ， 优 化 需 使 
用 统计 信息 确定 部 分 查询 结果 的 大 小 。 对 于 访问 计划 的 每 个 操作 符 ， 优 化 需 将 佑 计 该 操作 
符 的 基数 输出 。 应 用 一 个 或 更 多 个 谓词 可 以 减少 箱 出 流 基 数 。 
在 计算 谓词 对 于 基数 估计 值 的 组 合 过 滤 效 果 时 ， 通 沼 会 假设 这 些 谓词 彼此 之 间 是 独立 
的 。 但 在 统计 方面 ， 这 些 谓词 可 以 彼此 关联 。 单 独 地 处理 多 个 谓词 通 津 会 导致 优化 占 低 估 
基数 值 。 而 基数 值 的 低估 又 会 导致 优化 器 选择 次 优 的 访问 计划 。 
优化 器 会 考虑 使 用 多 列 统计 信息 来 检测 统计 关联 ， 并 更 加 准确 地 估计 多 个 谓词 组 合 的 
过 滤 效 果 。 本 节 描 述 了 优化 器 如 何 利用 多 列 统 计 信 息 来 检测 统计 关联 ， 并 更 加 ;准确 地 估算 
多 个 等 式 谓 词 对 应 用 了 至 少 两 个 本 地 IN、OR 和 等 式 谓 词 的 SQL 语句 的 组 合 过 滤 效 果 ， 以 
及 应 用 了 采种 等 级 的 OR 谓词 的 SQL 语句 的 过 小 效果 。 利 用 DB2 列 组 统计 信息 ， 优 化 器 
可 以 在 多 个 谓词 相关 联 时 确定 更 好 的 但 询 访问 计划 并 提高 得 询 性 能 。 


多 个 本 地 等 式 和 本 地 IN 谓词 的 统计 关联 
如 果 SQL 语句 的 WHERE 子 句 使 用 了 多 个 谓词 : 


TEN CR IN (2 35 2) 


并 且 收 集 了 (Cl1，C2) 的 多 列 统计 信息 的 话 ， 奢 么 优化 帮 就 会 试看 检测 这 些 谓词 间 的 统 
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计 关 联 以 提 局 基数 估计 值 。 但 以 下 谓词 除外 : 
市 有 IN 或 OR 操作 符 的 连接 谓词 。 
e 和 带 有 不 等 式 、LIKE 或 IS NULL 操作 符 的 本 地 谓词 。 
e。 带 有 子 查 询 的 谓词 。 
“C1=?” 请 词 束 是 本 地 等 式 谓词 的 一 个 例子 。 本 地 等 式 谓词 是 应 用 于 单个 表 的 等 式 请 
问 ， 拉 述 如 下 : 


COLUMN = literal 


其 中 的 literal 可 以 是 以 下 任 一 内 容 : 
e 人 第 量 人 
e 参数 标记 或 主 变量 
e 专用 寄存 器 (例如 CURRENT DATE) 
“C2 IN (?,?,3 )” 谓 词 则 是 本 地 IN 谓词 的 一 个 例子 。 本 地 IN 谓词 是 应 用 于 同一 表 
格 一 一 与 本 地 谓词 应 用 的 表格 相同 等 式 谓词 ， 质 述 如 下 : 


COLUMN IN ( <VALUE LIST> ) 


其 中 <VALUE LIST> 是 以 运 号 隔 开 的 一 个 或 多 个 上 述 (在 本 地 等 式 谓 词 中 )hiteral 的 
列表 。 

相当 于 IN 谓词 的 OR 谓词 可 以 代 荐 IN 谓词 在 SQL 语句 中 指定 , 而 且 优 化 规 将 会 在 说 
明 统 计 关 联 时 按 相 同 的 方式 处 理 之 ， 也 就 是 说 : 


COP orl lel 


相当 于 


FEOF BerioReor Teerm om OR oor Irieoraln 
下 面 是 优化 器 为 本 地 IN、OR 和 等 式 谓词 检索 统计 关联 的 例子 : 


COB] IN TT <VALUE LLIST> ) AND COL 2 11iteral AND CO Sliteral 
(Cob I literal 1 OR CoE 1 — Tteral 2 OF 0 DR ECOL l=1iilernal ny AND 
CD 2=1iteral ANMD =:: ENMD COL m1litaral 
COL 1 IN ( <VALUE LIST> ) AND COL 2 IN ( <VALUE LIST> } AND ... AND COL m 
IN ( <VALUE LIST> ) 
{COLE 1=1literal 1 OR COE l=1lteral 2 AMD (COL 2=11iteral T OR 
EOL 2=11Eeral 2)Y BND 220 BMD {COG qo iiteral 1 OR CoO Miteral 2 
COL 1 IN ( <VALUE LIST> } AND ... And COL m IN ( <VALUE LIST> ) AND 
CoOL 1 2=literal AND 2. AMD COL 1 k=—1literal 
(CO IEeralT oR Coo TEST 2 ND CO TECNNOUEOPO liteoral 
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tr = literal | OR CA 1— lteral 2 ANMBD tOL 2=l7teral Lm 
吉明 


下 面 这 些 是 优化 需 不 会 考 碟 为 其 从 名 统计 关联 的 谓词 的 例子 : 


(oo 1 TI1teral AND CO 2— J teraly OF [CO -liieral MND CoOl 2—]ikeral ZANE 
Eo 3=TiEeradly 

(OE 414=11teral AND COD 2=11teraly OR (COL. 1 Literal AND CO 2=1T17teralyy aM 
COL 3=literal 

( COL 1 IN ( <VALUE LIST> ) OR (COL 2 IN ( <VALUE LIST> ) ) AND Eom Titerol 


下 面 举 几 个 列 组 统计 信息 更 新 的 示例 : 
例 8-21 C1 IN(<VALUE LIST> )AND C2 = literal。 
考虑 对 SAMPLE 数据 库 的 EMPLOYEE 表 执 行 如 下 得 询 : 


SELECT FIRSTNME, LASTNAME, JOB, WORKDEPT, SALARY FROM EMPLOYEE 
WHERE JOB IN (CLERK", "SALESREP")} AND WORKDEPT = “ADO" ORDER BY JOB, 
SALARY 


该 查询 从 EMPLOYEE 表 返 回 4 条 记录 : 


FIRSTNME, LASTNAME, JOB WORKDEPT SALARY 
GREG ORLANDO CLERK A00 392500.00 
SEAN DO CONNELL CLERK AU 49220.00 
DIAN HEMMINGER SALESREP AU0O0 46500.00 
VINCENZO LUCCHESSI SALESREP AOO 66500.00 


4 record(s) selected. 


SAMPLE 在 创建 最 初 ， 还 没有 在 表 上 收集 统计 信息 。 为 了 你 证 执行 计划 的 准确 性 ， 需 
要 更 新 表 EMPLOYEE 的 统计 信息 。 下面 的 RUNSTATS 命令 在 EMPLOYEE 表 的 每 一 列 上 
收集 了 统计 信息 ， 包 括 分 布 统计 信息 和 所 有 在 EMPLOYEE 表 中 定义 的 索引 上 的 详细 统计 
信息 (如 果 存 在 的 话 ): 


RUNSTATS ON TABLE DB2INSTIT1L .EMPLOYEE WITH DISTRIBUTION AND DETAILED INDEXES ALL 
下 面 我 们 使 用 db2expln 来 查看 该 SQL 语句 的 执行 计划 : 


sdb2expln -QQ Sample -9 "SELECT FIRSTNME, LASTNAME, JOB, WORKDEPT, SALARY 
FROM EMPLOYEE WHEAND WORKDEPT = "A0O0' ORDER BY JOB, SALARY™ -—t 

Estimated Cost = 7.669430 

Estimated Cardinality = 1.190476 

Access Table Name = ORACLE.EMP] ID = 3,12 

| #Columns = 4 
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| Avolid Locking Committed Data 
| Evaluate Block/Data Predicates Before Locking Committed Row 
| Relation Scan 


访问 计划 如 上 所 示 ， 它 的 估计 基数 为 1.190476， 该 值 与 实际 返回 的 4 行 结果 不 符 。 这 
是 因为 优化 器 假定 两 个 谓词 是 独立 的 ， 因 为 相关 的 索引 或 列 组 统计 信息 不 存在 。 我 们 可 以 
使 用 RUNSTATS 命令 在 (JOB,WORKDEPT) 上 收集 列 组 统计 信息 ， 以 此 为 优化 占 提 供 适 当 
的 信息 来 检测 两 个 列 之 间 的 统计 关联 (如 果 存 在 的 话 ): 


RUNSTATS ON TABLE DB2INSTL1 .EMPLOYEE ON ALL COLUMNS AND COLUMNS 
( (JOB, WORKDEPT)) WITH DISTRIBUTION AND DETAILED INDEXES ALL 


重复 上 面 的 步骤 ， 册 次 解释 租 询 ， 然 后 生成 租 询 访问 计划 ， 优 化 夯 会 计算 出 一 个 更 好 
的 基数 佑 计 值 ， 因 为 它 在 两 个 列 上 收集 了 列 组 统计 信息 : 


sdb2expln -d sample -9 "SELECT FIRSTNME, LASTNAME, JOB, WORKDEPT, SALARY 

FROM EMPLOYEE WHERE JOB IN (CELERK ， "SALESREP") AND WORKDEPT = "AO00' 
ORDER BY JOB, SALARY™ 一 七 

Estimated Cost = 118.487167 

Estimated Cardinality = 53.000000 

Access Table Name = ORACLE.EMPLOYEE ID = 2,6 

| #Cojumns = 4 

| Volatile Cardinality 

| Avolid Locking Committed Data 

| Evaluate Block/Data Predicates Before Locking Committed Row 

| Relation Scan 


由 于 列 组 统计 信息 是 均匀 分 布 的 统计 信息 ， 而 实际 数据 分 布 是 不 均匀 的 ， 因 此 基数 估 
计 值 比 实 际 值 4 高 了 一 些 , 您 可 能 已 经 注意 到 了 ,访问 计划 本 里 的 评估 成 本 (Estimated Cost) 
并 未 随 看 基数 估计 值 的 增 大 而 显著 改变 。 这 是 因为 本 例 中 摘 述 的 例子 都 很 简单 ， 数 据 量 非 
着 小 (只 有 42 条 记录 )。 如 果 语 句 涉 及 更 大 的 表 和 两 个 或 更 多 个 表 的 连接 的 话 ， 伍 询 访 问 计 
划 束 很 可 能 会 因为 基数 估计 值 的 提高 而 显著 改变 。 

例 8-22 C1 IN (<VALUE LIST> )AND C2 IN (<VALUE LIST> )。 

这 个 示例 解释 说 明了 在 两 个 IN 谓词 上 的 列 组 统计 信息 的 效果 。 考 虑 以 下 检索 某 一 部 
门 的 经 理 和 设计 人 员 的 奖金 和 新 水 的 得 询 : 

SELECT FIRSTINME,, LASTNAME, WORKDEPT, JOB, BONUS, SALARY FROM EMPLOYEE, 


WHERE WORKDEPT IN ("D11, "D21") AND JOB IN ("MANAGER', "DESIGNER") 
ORDER BY WORKDEPT, SALARY 
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该 查询 从 EMPLOYEE 表 返 回 12 条 记录 : 


FTIRSINMP LASTNAME WORKDEPT JOB BONUS SALARY 

MASATOSHI YOSHIMURA DI1l DESIGNER 200.00 44680 .00 
JENNIFER LUTZ DLL DESIGNER 600.00 49840 .00 
JAMES WALKER D11 DESIGNER 400.00 J0420.00 
MARLLYN SCOUTTEN D11 DESIGNER J00.00 31340.00 
BRUCE ADAMSON D1l1 DESIGNER 500 .00 209280.00 
DAVID BROWN D11 DESIGNER 600.00 J1140.00 
ELIZABETH PIANKA D11 DESIGNER 400.00 62200.00 
KIYOSHI YAMAMOTO D11 DESIGNER 00 .00 64680.00 
WILLIAM JONES D11 DESIGNER 400.00 6821710.00 
REBA JOHN D11 DESIGNER 600.00 69840 .00 
TRVING STERN DIT MANAGER 人 昌吉 如 T2250.00 
EVA PULASKI D21 MANAGER 100.00 96110.00 


12? record(s)} selected. 


首先 ， 在 没有 获得 (JOB，WORKDEPT) 列 组 统计 信息 的 情况 下 检查 访问 查询 计划 和 基 
数 估 计 值 。 可 以 按 如 下 方式 在 EMPLOYEE 表 上 执行 男 一 个 RUNSTATS 命令 来 完成 该 
检查 : 


RUNSTATS ON TABLE DB2INST1 .EMPLOYEE WITH DISTRIBUTION AND DETAILED INDEXES ALL 


由 于 前 面 收集 的 统计 信息 被 最 新 的 RUNSTATS 命令 清除 了 ， 因 此 先前 收集 的 列 组 统 
计 信 息 不 复 存在 。 骨 次 运行 db2expln 来 得 看 该 SQL 语句 的 执行 计划 ， 以 此 来 检查 优化 紫 
估计 的 基数 : 


$db2expln -d sample -q "SELECT FIRSTNME, LASTNAME, WORKDEPT, JOB, BONUS, 
SALARY FROM EMPLOYEE WHERE WORKDEPT IN ("DI1Il1, D21") AND 
JOB IN (“MANAGER", "DESIGNER") ORDER BY WORKDEPT, SALARY ™” -tt 

Estimated Cost = 7.668932 

Estimated Cardinality = 7.285715 

AcCcess Table Name = ORACLE.EMP] ID = 3,12 

| #Columns = 6 

| Avoid Locking Committed Data 

| Evaluate Block/Data Predicates Before Locking Committed Row 

| Relation Scan 

| | Prefetch: Eligible 

| Lock Intents 

| | Table: Intent Share 


oR .Es 
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基数 估计 值 7.285715 与 实际 返回 的 12 行 结果 不 符 。 和 例 8-21 一 样 ， 在 (JOB， 
WORKDEPT) 上 收集 列 组 统计 信息 会 在 计算 两 个 IN 谓词 的 组 合 过 滤 效 果 时 为 优化 器 提供 
必要 的 信息 ， 用 以 说 明 统计 关联 : 


RUNSTATS ON TABLE DB2INST1] .EMPLOYEE ON ALL COLUMNS AND COLUMNS 
( (JOB, WORKDEPT)) WITH DISTRIBUTIOQON AND DETAILED INDEXES ALL 


重复 上 面 的 步骤 ， 再 次 解释 查询 ， 在 生成 查询 访问 计划 之 后 ， 优 化 器 会 计算 出 一 个 更 
好 的 、 与 实际 结果 很 接近 的 基数 估计 值 11.200000: 


sdb2expln -d sample -9q "SELECT FIRSTNME, LASTNAME, WORKDEPT, JOB, BONUS ， 
SALARY FROM EMPLOYEE WHERE WORKDEPT IN (‘DIl1, D21") AND 
JOB IN (MANAGER ， "DESIGNER") ORDER BY WORKDEPT, SALARY ” -tt 

Estimated Cost = 117.296455 

Estimated Cardinality = 11.200000 

Access Table Name = ORACLE.EMPLOYEE ID = 2,6 

| #Columns = 6 

| Volatile Cardinality 

| Avolid Locking Committed Data 


例 8-23 Cl IN (<VALUE LIST> )AND C2 IN (<VALUE LIST> ) AND C3=literal。 
在 这 个 例子 中 , 将 向 例 8-22 的 查询 中 添加 第 3 个 谓词 ， 以 确定 有 哪些 职工 得 到 了 $500 
的 奖金 : 


SELECT FIRSTNME, LASTNAME, WORKDEPT, JOB, BONUS, SALARY FROM EMPLOYEE 
WHERE WORKDEPT IN ("D11, "D21") AND JOB IN ("MANAGER'", DESIGNER ) AND 
BONUS = 300 ORDER BY WORKDEPT, SALARY 


该 查询 从 EMPLOYEE 表 返 回 $ 条 记录 : 


FIRSTNME LASTNAME WORKDEPT JOB BONUS SALARY 
MASATOSHI YOSHIMURA D1l1 DESIGNER 500.00 44680.00 
MARILYN SCOUTTEN D11 DESIGNER 500.00 91340.00 
BRUCE ADAMSON DT DESIGNER 500 .00 9280.00 
KIYOSHI YAMAMOTO DI1]T DESIGNER 500.00 64680.00 
IRVING STERN D11 MANAGER 500.00 12250.00 
D record(s) selected. 
如 果 使 用 如 下 代码 : 


RUNSTATS ON TABLE DB2INSTIL .EMPLOYEE 
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WITH DISTRIBUTION AND DETAILILED INDEXES ALL 


在 没有 列 组 统计 信息 的 情况 下 再 次 收集 统计 信息 ， 优 化 器 会 选择 类 似 如 下 所 示 的 查询 
访问 计划 ， 它 的 基数 估计 值 为 2.428572: 


$db2expln -d sample -qd "SELECT FIRSTNME, LASTNAME, WORKDEPT, JOB, BONUS, 
SALARY FROM EMPLOYEE WHERE WORKDEPT IN ("DI1Il1','D21") AND JOB IN 
( -MANAGER , "DESIGNER") AND BONUS = JUU0 ORDER BY WORKDEPT, SALARY™ —t 
Estimated Cost = 7.683424 
Estimated Cardinality = 2.428572 
Access Table Name = ORACLE.EMP]1] ID = 3,12 
| #Columns = 5 
| Avoid Locking Committed Data 
| Evaluate Block/Data Predicates Before Locking Committed Row 
| Relation Scan 
| | Prefetch: Eligible 
ock THents 0 ee 


WHERE 子 句 中 应 用 了 3 个 谓词 ， 如 果 假 设 它们 是 独立 的 ， 那 么 会 导致 优 化 器 低估 基 
数 。 为 了 解释 说 明 优 化 需 如 何 使 用 索引 统计 信息 以 及 列 组 统计 信息 来 检测 统计 关联 ， 创 建 
带 有 在 谓词 中 引用 的 3 个 列 JOB，WORKDEPT，BONUS) 的 索引 并 收集 统计 信息 : 


CREATE INDEX JOB DEPT BONUS ON EMPLOYEE (JOB,WORKDEPT, BONUS ) 

-一 The RUNSTATS command provides the option to collect statistics on a set of 

-— indexes only, without affecting the statistics previously collected. 

RUNSTATS ON TABLE DB2INSTL1 .EMPLOYEE FOR DETAILED INDEXES 
DBzZINST1 .JOB DEPT BONUS 


然后 优化 占 会 使 用 独创 建 的 索引 和 在 其 上 收集 的 统计 信息 来 更 正 会 询 访 问 计 划 的 基 


数 估计 值 : 
Estimated Cost = 7.668263 
Estimated Cardinality = 5.250000------- 这 个 值 和 实际 返回 的 5 行 相近 
Table Constructor 
| 2—-Row(S) 


Nested Loop Join 

| Access Table Name = ORACLE .EMP1 ID = 3,12 

| | Index Scan: Name = ORACLE .JOB DEPT BONUS ID = 1 
| Regular Index {Not Clustered) 

Index Columns.: 

| 1: JOB (Ascend1ing) 

| 2: WORKDEPT (Ascending) 


I 
| | 
I 
me 
| | | 3: BONUS (Ascending) 
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例 8-24 Cl=literal OR Cl=literal2) AND (C2=literal OR C2=literal2) AND C3=literal。 
这 个 例子 与 例 8-23 等 效 ， 它 使 用 了 等 效 的 OR 谓词 来 代 蔡 IN 谓词 : 


SELECT FIRSTNME, LASTNAME, WORKDEPT, JOB, BONUS, SALARY FROM EMPLOYEE 
WHERE (WORKDEPT = DLL ”DR WORKDEPT = "D21") AND (JOB = "MANAGER" OR 
JOB = “DESIGNER ) AND BONUS = J00 ORDER BY WORKDEPT, SALARY 


该 查询 返回 的 结果 与 例 8-23 相同 。 这 个 示例 解释 说 明了 部 分 统计 信息 对 于 优化 器 估计 
基数 的 能 力 的 影响 。 删 除 例 8-23 中 创建 的 索引 ， 并 只 使 用 JOB，WORKDEPT) 上 的 列 组 统 
计 信 息 再 次 收集 统计 信息 : 


DROP INDEX JOB DEPT BONUS 
RUNSTATS ON TABLE DB2INSTL .EMPLOYEE ON ALL COLUMNS AND COLUMNS 
( (JOB, WORKDEPT)}) WITH DISTRIBUTION AND DETAILED INDEXES ALL 


使 用 在 合适 的 IN、OR 和 等 式 俏 词 引 用 的 列 的 子 集 上 收集 的 列 组 统计 信息 ， 优 化 右 估 
计 出 了 一 个 更 接近 于 其 实 结果 的 基数 。 但 如 果 列 组 统计 信息 是 在 全 部 3 个 列 上 收集 的 话 ， 
该 估计 值 的 精确 上 度 要 低 于 例 8-23 中 所 示 的 值 : 


Estimated Cost = 7.683424 

Estimated Cardinality = 2.428572 

Access Table Name = ORACLE.EMP] ID = 3,12 

#Columns = 5 

Avoid Locking Committed Data 

Evaluate Block/Data Predicates Before Locking Committed Row 
Relation Scan 

| Prefetch: Eligible 

Lock Intents 


优化 强 使 用 了 在 (JOB，WORKDEPT) 上 收集 的 列 组 统计 信息 来 说 明 两 个 OR 谓词 间 的 
统计 关联 , 但 不 包括 列 组 中 的 BONUS, 它 认 为 BONUS=500 谓词 独立 于 那 两 个 OR 谓词 ， 
结果 导致 稍稍 低估 了 最 终 的 基数 。 


注意 : 
如 果 使 用 可 视 化 解释 或 db2exfmt 输出 的 Optimized Statement 部 分 ， 那 么 您 会 注意 到 
该 SQL 语句 的 OR 谓词 被 转换 成 与 它们 等 效 的 IN 谓词 : 


optimized Statement : 
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SELECT OD.FIRSTNME AS "FIRSTNME”, QV.LASTNAME AS TARASTINAMP ”只 D -WORKDEET 
AS WORKDPPT - ，Q -JOB AS "JOB"™, +0000500.00 AS “ BONUS” ，&D.-3SALARY AS 
"SALARY"FROM DB2INSTL .EMPLOYEE AS QD 
WHERE {(Q3.BONUS = +0000500.00) AND Bo -JOB IN ("MANAGER -， DESIGNER ) AND 
避 J -WORRKEDEET IN {DIl', D21"})} ORDER BY QQ35 -WORKDEEPET， O03 -SALRARY 


在 全 部 3 列 上 收集 列 组 统计 信息 会 导致 与 例 8-23 相同 的 基数 估计 值 。 在 这 种 情况 下 ， 
您 仍然 在 前 面 的 JOB ，WORKDEPT) 上 收集 列 组 统计 信息 ， 并 包括 整个 3 列 (JOB， 
WORKDEPT, BONUS): 

RUNSTATS ON TABLE DB2INST|L .EMPLOYEE ON ALL COLUMNS AND COLUMNS 


( (JOB, WORKDEPT), (JOB,WORKDEPT,BONUS)) WITH DISTRIBUTION AND DETALTLLED 
INDEXES ALL 


您 可 以 在 相同 的 列 集合 则 收集 到 一 个 或 更 多 的 列 组 统计 信息 。 收 集 这 些 统计 信息 后 ， 
生成 的 查询 访问 计划 与 例 8-23 中 最 后 的 计划 相同 。 至 于 这 种 情况 的 验证 就 留 给 读者 目 己 做 
练习 。 

例 8-25 (Cl1=LITERAL!]1 AND C2=LITERAL?2)OR(C1=LITERAL3 AND C2=LITERAIA). 

这 个 例子 解释 说 明了 列 组 统计 信息 对 合格 的 OR 谓词 的 影响 。 考 虑 在 EMPLOYEE 表 

SELECT FIRSTNME, LASTNAME, WORKDEPT, JOB, BONUS, SALARY FROM EMPLOYEE, 


WHERE ( WORKDEPT=" E21" AND JOB= FIELDREP" ) OR( WORKDEPT=" D21 AND JOB= MANAGER ) 
ORDER BY WORKDEPT, SALARY 


该 查询 从 EMPLOYEE 表 返 回 6 条 记录 : 


FIRSTNME LASTNAME, WORKDEPT JOB BONUS SALARY 
EVA PULASKI D21 MANAGER 100.00 96170 .00 
ROY ALONZO E21 FIELDREP 53500.00 31840.00 
HELENA WONG REZ] FIELDREP 500.00 人 0 
RAMLAL MEHTA E21 FIELDREP 400.00 针 生 和 5 和 -和 有 自 
JASON GOUNOT E21 FIELDREP 200 .00 43840 .00 
WING LEE E21 FIELDREP 500.00 3 000 
6 record(s) selected. 

如 条 使 用 如 下 代码 : 


RUNSTATS ON TABLE DB2TNST] .EMPLOYEE WITH DISTRIBUTION AND DETAILED INDEXES ALL 


在 没有 列 组 统计 信息 的 情况 下 再 次 收集 统计 信息 的 话 ， 优 化 器 会 选择 类 似 如 下 所 示 的 
查询 访问 计划 ， 它 的 基数 估计 值 为 1.880952: 
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Estimated Cost = 7.718598 

Estimated Cardinality = 1.880952 

Access Table Name = ORACLE.EMP]1] ID = 3,12 
| #Columns = 6 

| Avoid Locking Committed Data 

| Evaluate Block/Data Predicates Before Locking Committed Row 
| Relation Scan 

| | Prefetch: Eligible 

| Lock Intents 

Tabler TIntont chare a 


在 (JOB，WORKDEPT) 上 收集 列 组 统计 信息 能 够 让 优化 器 更 好 地 估计 OR 谓词 的 过 滤 
效果 ,因为 OR 谓词 的 每 一 个 子 项 都 在 JOB 和 WORKDEPT 列 上 应 用 了 一 组 本 地 等 式 谓 词 。 
确定 合适 的 RUNSTATS 语句 来 收集 列 组 统计 信息 : 


RUNSTATS ON TABLE DB2INST] .EMPLOYEE ON ALL COLUMNS AND COLUMNS 
( (JOB, WORKDEPT)) WITH DISTRIBUTION AND DETAITILED INDEXES ALL 


收集 了 列 组 统计 信息 之 后 ， 优 化 器 会 选择 类 似 如 下 所 示 的 查询 访问 计划 ， 它 的 基数 估 
计 值 提高 了 ， 与 实际 的 结果 (6 行 ) 很 接近 : 

Estimated Cost = 128.489594 

Estimated Cardinality = 3.600000 

Access Table Name = ORACLE.EMPLOYEE ID = 2,6 

| 3#Columns = 6 

| Volatile Cardinality 

| Avolid Locking Committed Data 

| Evaluate Block/Data Predicates Before Locking Committed Row 

| Relation Scan 

| | Prefetch: Eligible 


上 面 我 们 给 大 家 讲解 了 一 些 列 组 更 新 的 和 示例， 优化 器 凭借 精确 的 基数 估计 值 来 准确 计 
算出 每 一 个 待定 但 询 访问 计划 的 成 本 。 您 可 以 利用 DB2 中 的 列 组 统计 信息 的 扩展 用 途 来 为 
优化 器 提供 更 多 的 信息 ， 从 而 使 优化 器 更 好 地 估计 基数 、 选 择 最 佳 的 查询 访问 计划 。 列 组 
统计 信息 对 于 处 理 复杂 的 OLAP 查询 来 说 尤其 重要 。 


8.1.6 ”分布 统计 信息 更 新 


当 您 确定 表 中 数据 分 布 不 均匀 时 ， 可 以 运行 包含 WITH DISTRIBUTION 子 句 的 
RUNSTATS 命令 。 系 统 日 录 表 中 的 统计 信息 通常 包 舍 关于 表 中 最 高 值 和 最 低 值 的 信息 ， 而 
优化 器 假定 数据 值 是 在 两 个 端点 值 之 间 均 匀 分 布 的 。 然而 , 如 果 数 据 值 彼此 之 间 差 异 较 大 ， 
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路 径 ， 除 非 收集 了 分 布 统计 信息 。 使 用 WITH DISTRIBUTION 于 名 还 可 以 帮助 得 询 处 理 没 
有 参数 标记 (parameter marker) 或 主机 变量 的 谓词 ， 因 为 优化 需 仍 然 不 知道 运行 时 的 值 是 有 
许多 行 ， 还 是 只 有 少数 行 。 
可 以 收集 两 种 数据 分 布 统计 信息 : 
e 频率 统计 信息 : 这 些 统计 信息 提供 关于 num_freqvalues 数据 库 配 置 参 数 的 值 所 指 
定 级 别 的 具有 最 高 重复 值 和 次 高 重复 值 的 列 和 数据 值 的 信息 。 其 默认 值 是 10， 建 
议 将 这 个 值 设 置 在 10 到 100 之 间 。 如 果 将 num_freqvalues 设置 为 零 ， 那么 不 保留 
任何 频率 值 的 统计 信息 。 还 可 以 将 num freqvalues 设置 为 每 个 表 、 统 计 信 息 视 图 
和 特定 列 的 RUNSTATS 选项 。 
e 分 位 数 统 计 信 息 : 这 些 统计 信息 提供 关于 与 其 他 值 相 比 如 何 分 布 数据 值 的 信息 。 
称 为 K 分 位 数 ， 这 些 统 计 信 息 表 示 值 VY， 全 少 K 个 值 位 于 该 值 或 该 值 以 下 。 可 以 
通过 按 升 序 排序 值 来 计算 及 分 位 数 。 玉 分 位 数值 是 从 范围 的 低 站 起 第 及 个 位 置 中 
的 值 。 
要 指定 应 该 将 列 数据 值 分 组 成 的 部 分 数 ， 将 num_quantiles 数据 库 配 置 参 数 设 置 为 2 
到 32 767 之 间 的 荣 个 值 。 默 认 值 为 20， 它 确保 对 任何 相等 、 小 于 或 大 于 谓词 的 优化 器 估 
计 误 差 最 大 为 正 或 负 2.5%， 而 对 任何 BETWEEN 谓词 的 最 大 误差 为 正 或 负 5%。 要 禁用 分 
位 数 统 计 信息 收集 ， 将 num_gquantiles 设置 为 0 或 1。 可 以 对 每 个 表 或 统计 信息 视图 以 及 特 
定 惠 充 直 num quantiles。 


提示 : 

如 果 没 有 在 RUNSTATS 命令 的 列 或 表 级 别 上 指定 num freqvalues 和 num gquantiles， 
那么 num freqvalues 的 值 将 从 num freqvalues 数据 库 配 置 参数 中 获取 ， 而 num quantiles 
的 值 将 从 num gquantiles 数据 库 配置 参数 中 获取 。 如 果 指 定 较 大 的 num freqvalues 和 
num quantiles 值 ， 那 么 执行 RUNSTATS 时 将 需要 更 多 的 CPU 资源 和 内 存 。 通 过 
stat jheam Sz 数据 库 配 置 参数 来 指定 CPU 资源 和 内 存量 。 


可 以 为 单个 列 或 一 组 列 修改 频率 和 分 位 数 统计 信息 的 精确 度 。 提 高 分 布 统计 信 息 的 精 
人 硝 度 将 导致 更 大 的 CPU 和 内 存 消 耗 ， 并 占用 更 多 的 系统 目录 表 空 间 。 对 于 这 些 分 布 统计 信 
县 ， 只 考虑 对 于 拥有 选择 谓词 的 最 重要 的 得 询 而 言 最 为 重要 的 列 。 
当 出 现下 列 任何 一 种 条 件 时 ，RUNSTATS 将 不 收集 分 布 统计 信息 : 
e 当 将 num freqvalues 配置 参数 设置 为 零 (0)， 以 及 当 将 num_gquantiles 数据 库 配 置 参 
数 设 置 为 等 (0) 或 1 时 。 
e 当 每 个 数据 值 是 唯一 的 时 候 。 
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e 当 该 列 是 LONG、LOB 或 结构 化 列 时 。 

e 当 列 中 只 有 一 个 非 空 值 时 。 

e 声明 的 临时 表 。 

何 时 收集 分 布 统计 信息 

要 决定 是 否 应 创建 和 更 新 给 定 表 或 统计 信息 视图 的 分 布 统计 信息 ， 考 虑 以 下 两 个 

因素 : 

e 应 用 程序 是 否 使 用 静态 或 动态 SQL 和 XQuery 语句 。 分 布 统计 信息 对 不 使 用 主 变 
量 的 动态 会 询 和 静态 查询 最 有 用 。 当 使 用 具有 主 变 量 的 查询 时 ， 优 化 占 只 能 有 限 
地 利用 分 布 统计 信息 。 

e 列 中 的 数据 是 否 是 均匀 分 布 的 。 如 果 该 表 中 人 至少 有 一 列 的 数据 分 布 非常 “不 均匀 ”， 
并 且 该 列 频繁 出 现在 等 式 或 范围 谓词 中 ， 也 就 是 类 似 如 下 所 示 的 子 名 中， 那么 着 
虑 收集 分 布 统计 信息 。 

WHERE Cl = KEY:; 

WHERE CL IN (BEYT: KEY2. KEY3); 

WHERE (Cl = KEY])}) OR (Cl = KEY2) OR {Cl = REY3)}.; 

WHERE Cl <= KEY:; 

WHERE Cl BETWEEN KEY] AND KEY2; 

可 能 发 生 两 种 类 型 的 不 均匀 数据 分 布 (可 能 一 起 发 生 ): 

e 可 能 按 一 个 或 多 个 子 间隔 集群 数据 ， 而 不 是 均匀 地 在 最 高 和 最 低 数 据 值 之 间 分 布 。 
考虑 以 下 列 ， 其 中 的 数据 在 范围 (9, 10) 内 集群 : 

Cl] 

0.0 
.1 
0.3 
1.1 
8.2 
8.4 
8.9 
9.1 


93.6 
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100.0 
分 位 数 统计 信息 可 以 帮助 优化 器 处 理 这 种 类 型 的 数据 不 均匀 分 布 。 
要 帮助 确定 是 否 不 是 均匀 分 布 的 列 数 据 ， 执 行 诸如 以 下 所 示 的 查询 : 


SELECT Cl, COUNT (*) AS OCCURRENCES FROM Tl1 GROUP BY Cl ORDER BY OCCURRENCES DESC; 
e 重复 数据 值 可 能 经 常 出 现 。 考 虑 使 用 表 8-1 所 示 频 率 分 布 数据 的 列 。 


表 8-1 数据 及 其 频率 分 布 


效 据 值 频率 
20 5 
30 10 
40 10 
50 25 
60 25 
70 20 
80 5 


要 帮助 优化 强人 处 理 午 复 值 ， 可 以 创建 分 位 数 和 局 频 值 统计 信息 。 


要 指定 哪个 级 别 的 统计 精度 

要 确定 存储 分 布 统计 信息 使 用 的 精度 ， 指 定数 据 库 配 置 参 数 num_gquantiles 和 
num_freqvalues。 还 可 以 指定 这 些 参数 作为 收集 表 或 列 的 统计 信息 时 的 RUNSTATS 选项 。 
这 些 值 设 置 得 越 大 ，RUNSTATS 创建 和 喝 新 分 布 统计 信息 时 使 用 的 精度 越 遇 。 但 是 ， 精 谍 
越 局 ， 在 RUNSTAIS 执行 期 间 和 在 目录 表 中 所 需要 的 存储 器 中 需要 使 用 的 资源 丈 越 多 。 

对 于 大 多 数 数据 库 ， 为 num_freqvalues 数据 库 配 置 参 数 指定 10 到 100 之 则 的 数 。 理 论 
上 ， 应 创建 局 频 值 统 计 人 信息， 以 便 其 余 值 的 频率 可 近似 等 于 最 局 频 值 的 频率 ， 或 者 相 比 之 
下 可 以 忽略 不 计 。 数 据 库 管理 堪 收 集 的 数目 可 能 低 于 此 数 ， 因 为 只 对 出 现 多 次 的 数据 值 收 
集 这 些 统计 信息 。 如 末 需 要 只 收集 分 位 数 统计 信 息 ， 那 么 将 num_freqvalues 设置 为 0。 

要 设置 分 位 数 的 数目 ,指定 20 到 50 之 间 的 数 作 为 num_gquantiles 数据 库 配 置 参 数 的 值 。 
确定 分 位 数 数 日 的 经 验方 法 为 : 

e 俏 定 在 估计 任何 范围 玛 询 的 行 数 时 可 允许 的 最 大 钳 误 自分 比 P。 

e 如果 谓词 是 BETWEEN， 那 么 分 位 数 数 日 应 近似 为 100/P; 如 果 谓 词 是 任何 其 他 类 

型 的 范围 谓词 (<、<=、> 或 >=)， 那 么 分 位 数 数目 应 近似 为 50/P。 
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例如 ，25 个 分 位 数 导 致 的 最 大 估计 千 误 对 于 BETWEEN 谓词 应 为 4%， 而 对 于 “>” 
谓词 则 应 为 2%。 通 第 ， 人 至 少 指 定 10 个 分 位 数 。 对 于 极 站 不 均匀 的 数据 才 需 要 50 个 以 
上 的 分 位 数 。 如 果 只 需要 高 频 值 统 计 信 息 ， 那 么 将 num gquantiles 设置 为 0。 如 果 将 此 参 
数 设 置 为 “1”， 那 么 由 于 值 的 整个 了 犯 围 只 适合 分 位 数 ， 因 而 不 收集 分 位 数 统计 信息 。 


收集 特定 列 的 分 布 统 计 信 息 

为 了 所 高 RUNSTATS 和 后 续 查 询 方 案 分 析 的 效率 ， 可 以 仪 收集 查询 在 WHERE、 
GROUP BY 和 类 似 子 句 中 使 用 的 列 的 分 布 统计 信息 。 还 可 以 收集 关于 列 的 组 合 的 基数 统计 
信息 。 优 化 器 使 用 这 种 信息 ， 在 为 引用 组 中 列 的 查询 估计 选择 性 时 检测 列 相关 。 

注意 : 

RUNSTATS 仅 收 集 执 行 该 命令 的 数据 库 分 区 上 的 表 的 统计 信息 。 将 此 数据 库 分 区 的 
RUNSTATS 结果 推广 到 其 他 数据 库 分 区 。 如 果 执 行 RUNSTATS 的 数据 库 分 区 不 包含 表 的 
一 部 分 ， 那 么 将 请 求 发 送 到 数据 库 分 区 组 中 持 有 表 的 该 部 分 的 第 一 个 数据 库 分 区 。 

下 面 我 们 举 一 些 收集 特定 列 的 分 布 统计 信息 的 例子 。 

下 面 的 例子 说 明了 使 用 RUNSTATS 来 收集 包含 数据 分 布 信息 的 系统 目录 表 统 计 信息 
的 不 同方 法 。 

例 8-26 收集 表 和 索引 上 的 数据 库 统 计 信 息 ， 包 含 分 布 统 计 信息 。 

RUNSTATS ON TABLE db2i1instl.account WITH DISTRIBUTION AND INDEXES ALL 

例 8-27 收集 表 上 的 数据 库 统 计 信 息 以 及 索引 上 的 证 细 统 计 信 息 ,包含 分 布 统 计 信息 。 

RUNSTATS ON TABLE db21instl1.account WITH DISTRIBUTION AND DETAILED INDEXES ALL 

例 8-28 ”收集 选 定 列 中 包含 分 布 的 数据 库 统计 信息 。 


RUNSTATS ON TABLE db2instl.account WITH DISTRIBUTION ON COLUMNS (acctno, 


acctname) 
例 8-29 只 收集 表 上 的 数据 库 统 计 信 息 , 包 售 acctno 和 acctname 列 上 的 基本 列 统 计 信 
息 ， 以 及 msrmo 和 admrdept 列 上 的 分 布 统计 信息 。 


RUNSTATS ON TABLE db2instl.account ON COLUMNS (acctno, acctname) 
WITH DISTRIBUTION ON COLUMNS (mgrno, admrdept) 


例 8-30 ”收集 构成 索引 的 所 有 列 ， 以 及 两 个 非 索引 列 中 包含 分 布 的 数据 库 统 计 信息 。 


RUNSTATS ON TABLE db2instl.account WITH DISTRIBUTION ON KEY 
COLUMNS AND COLUMNS (admrdept, location) 
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下 面 的 例子 说 明了 使 用 RUNSTATS 来 收集 目录 统计 信息 和 指定 num_freqvalues 与 
num_quantiles 的 不 同方 法 。 

例 8-31 ”收集 包含 分 布 统计 信息 的 数据 库 统计 信息 。 

RUNSTATS ON TABLE db2instl.account WITH DISTRIBUTION AND INDEXES ALL 

在 上 面 的 例子 中 我 们 没有 指定 分 位 数 和 频率 统计 信息 ， 它 会 使 用 默认 值 ， 我 们 可 以 便 
询 数据 库 配 置 参 数 来 得 到 该 默认 值 ， 如 下 上 所 示 : 


/home/db21inst$db2 get db cfqg for sample | grep -1 "NUM " 


保留 的 局 频 值 的 数目 (NUM FREOVALUES) = 10 
保留 的 分 位 点 数目 (NUM QUANTILES) = 20 


例 8-32 仅 收 集 表 上 的 数据 库 统 计 人 信息， 其 中 使 用 指定 的 num freqvalues， 并 从 数据 
库 配 置 设置 选择 num quantiles 收集 所 有 列 上 的 分 布 统计 信息 。 

RUNSTATS ON TABLE db2instl.account WITH DISTRIBUTION DEFAULT 
NUM FREQVALUES 40 

将 num _freqvalues 参数 设置 为 40， 将 num _gquantiles 参数 设置 为 20。 

例 8-33 ”收集 表 上 的 数据 库 统计 信息 ， 包 含 列 acctno 和 acctname 上 的 分 布 统计 信息 。 
单独 为 acctname 列 设置 分 布 统计 信息 的 范围 ， 而 acctno 列 使 用 公共 的 默认 什 。 并 为 两 个 
索引 IDX1 和 IDX2 收集 数据 库 统 计 信 息 。 

RUNSTATS ON TABLE db2instl.account WITH DISTRIBUTION ON COLUMNS 

(acctno, acctname NUM FREQVALUES S50 NUM QUANTILES 100) DEFAULT 
NUM FREQVALUES 5 NUM QUANTILES 10 AND INDEXES db2inst1.IDX1, db2inst1 .IDX2 

对 于 acctname 人 询 ，num freqvalues 是 50，num quantiles 十 100。 

对 于 acctno 列 ，num freqvalues 是 5,，num quantiles 是 10。 

例 8-34 收集 所 有 索引 上 的 数据 库 统计 信息 ,包含 列 acctname 上 的 分 布 统计 信息 。 未 
列 出 的 列 上 的 分 布 统计 信息 将 被 清除 。 


RUNSTATS ON TABLE db21instl1.account WITH DISTRIBUTION ON COLUMNS 
(acctname NUM FREQVALUES 20 NUM QUANTILES 40) AND INDEXAES ALL 


对 村 acctname 列 ，num freqvalues 十 20，num quantiles 十 40。 
例 8-35 收集 所 有 索引 以 及 列 acctno 和 acctname 上 的 数据 库 统 计 信 息 。acctno 列 的 
num freqvalues 和 num quantiles 的 值 将 从 默认 值 中 获得 。 


RUNSTATS ON TABLE db2instl.account WITH DISTRIBUTION ON COLUMNS 
(acctno, acctname NUM FREQVALUES 20 NUM QUANTILES 40) DEFAULT 
NUM FREQVALUES U NUM QUANTILES 0 AND INDEXES ALDL 
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对 于 acctname 列 ，num freqvalues 是 20，num quantiles 十 40。 对 于 acctno 列 ， 
num freqvalues 是 0，num quantiles 是 0。 其 他 所 有 列 不 包含 任何 统计 信息 。 

总 的 来 说 ， 分 布 统计 信息 对 处 理 不 均匀 的 数据 分 布 非常 有 好 处 ， 它 可 以 让 优化 器 更 好 
地 选择 最 优 的 执行 计划 。 和 在 本 书 的 最 后 一 草 有 关于 使 用 分 布 统计 信息 所 高 性 能 的 和 案例， 请 
谈 者 仔细 阅读 该 案例 以 增强 对 分 布 统计 信息 的 理解 。 


8.1.7 ”统计 信息 更 新 策略 


在 下 列 情况 下 ， 使 用 RUNSTATS 命令 收集 统计 信息 : 
e 当 同 表 阔 入 数据 并 创建 了 新 的 案 引 时 。 
e 当 用 REORG 命令 重新 组 织 表 和 索引 时 。 
e 当 存 在 大 量 影 响 表 及 其 索引 的 更 新 、 删 除 和 插入 操作 时 (此 处 的 “大 量 ” 可 能 意味 
看 10% 到 20% 的 表 和 索引 数据 都 受到 了 影 响 )。 

e 在 绑 定 对 性 能 要 求 很 好 的 应 用 程序 之 前 。 

e 当 您 希望 将 新 的 和 以 前 的 统计 信息 进行 比较 时 。 定 期 进行 统计 使 您 能 够 在 早期 阶 
段 发 现 性 能 问题 。 

e 当 预 存 取 大 小 (prefetchsize) 发 生变 化 时 。 

e 当 在 表 中 创建 新 的 索引 时 。 如 果 自 从 上 次 在 表 中 运行 RUNSTATS 以 来 尚未 修改 表 ， 

那么 只 需要 对 新 的 索引 执行 RUNSTATS。 

e 使 用 RUNSTATS 命令 收集 关于 XML 列 的 统计 信息 。 如 果 仅 使 用 RUNSTATS 收 

集 XML 列 的 统计 信息 , 将 保留 LOAD 或 上 一 次 执行 RUNSTATS 命令 已 收集 的 非 
XML 列 的 现 有 统计 信息 。 如 果 先 前 已 收集 关于 一 些 XML 列 的 统计 信息 ， 那 么 在 
当前 命令 未 收集 关于 这 些 XML 列 的 统计 信息 时 ， 将 删除 先前 收集 的 XML 列 的 统 
计 信 息 ; 在 当前 命令 收集 了 关于 这 些 XML 列 的 统计 信息 时 ， 将 替换 先前 收集 的 
XML 列 的 统计 信息 。 

要 提高 RUNSTATS 性 能 并 节省 用 来 存储 统计 信息 的 磁盘 空间 , 可 以 考虑 仅 指定 需要 收 
集 其 数据 分 布 统计 信息 的 列 。 

如 果 您 没有 足够 的 时 间 一 次 收集 全 部 的 统计 信息 , 那么 可 以 运行 RUNSTATS 来 每 次 仪 
更 新 儿 个 表 、 索 引 或 统计 信息 视图 的 统计 信息 ， 并 轮流 完成 该 组 对 象 。 如 果 对 选择 性 部 分 
更 新 运行 RUNSTATS 期 间 由 于 表 上 的 活动 而 产生 了 不 一 致 性 , 那么 在 查询 优化 期 间 将 发 出 
警告 消息 (SQL0437W， 原 因 码 6)。 例 如 ， 如 果 执 行 RUNSTATS 来 收集 表 分 布 统计 信息 ， 
并 且 在 某 个 表 活动 后 , 再 次 执行 RUNSTATS 来 收集 该 表 的 索引 统计 信息 ,那么 可 能 发 生 这 
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种 情况 。 如 采 由 于 表 上 的 活动 产生 了 不 一 致 ， 并 且 在 查询 优 化 期 间 检 测 到 这 些 不 一 致 ， 那 么 
发 出 该 警告 消息 。 当 发 生 这 种 情况 时 ， 应 再 次 运行 RUNSTATS 来 更 新 分 布 统计 信息 。 

要 确保 索引 统计 信息 和 表 同 步 , 执行 RUNSTATS 来 同时 收集 表 和 索引 统计 信息 。 索 引 
统计 信息 你 留 目 上 次 运行 RUNSTATS 以 来 收集 的 大 部 分 表 和 列 的 统计 信息 。 如 果 目 上 次 
收集 该 表 的 统计 信息 以 来 已 对 该 表 做 了 大 量 修改 ， 那 么 只 收集 该 表 的 索引 统计 信息 将 使 两 
组 统计 信息 不 能 在 所 有 和 点 上 都 同步 。 

在 生产 系统 中 调用 RUNSTATS 可 能 会 对 生产 工作 负载 的 性 能 产生 负面 影响 。 
RUNSTATS 命令 现在 文 持 优先 级 选项 ， 在 执行 较 高 级 别 的 数据 库 活动 期 间 ， 可 以 使 用 优先 
级 选项 来 限制 执行 RUNSTATS 对 性 能 的 影响 。 

收集 视图 的 统计 信息 时 ， 将 收集 所 有 包含 该 视图 引用 的 基本 表 的 数据 库 统 计 信 息 。 

可 以 考虑 采用 以 下 技巧 来 提高 RUNSTATS 的 效率 和 已 收集 的 统计 信息 的 准确 性 : 


仅 对 用 来 连接 表 的 列 或 WHERE、GROUP BY， 以 及 查询 的 类 似 子 句 中 的 列 收集 
统计 信息 。 如 果 对 这 些 列 建立 了 索引 ， 那 么 可 以 用 RUNSTATS 命令 的 ONLY ON 
KEY COLUMNS 子 句 指定 列 。 

为 特定 表 和 表 中 特定 列 定制 num freqvalues 和 1211 quantiles 的 值 。num freqvalues 
提供 了 重复 最 多 的 列 和 数据 值 的 信息 。num_gquantiles 提供 了 数据 值 对 于 其 他 值 而 
言 是 如 何 分 布 的 有 关 信 息 。 

使 用 SAMPLED DETAILED 子 句 通过 抽样 计算 详细 的 索引 统计 信息 ， 这 样 惑 可 以 
减少 为 获得 详细 索引 统计 信息 而 执行 的 后 台 计 算 量 ， 使 用 SAMPLED DETAILED 
子 句 可 以 减少 收集 统计 信息 所 需要 的 时 间 ， 并 在 大 多 数 情况 下 产生 足够 的 精度 。 
当 创 建 已 装载 数据 的 表 的 索引 时 , 添加 COLLECT STATISTICS 子 句 来 在 创建 索引 
时 创建 统计 信息 ， 这 一 技巧 在 Oracle 环境 下 也 同样 适用 。 

当 添 加 或 删除 了 大 量 数 据 时 ， 或 更 新 了 收集 其 统计 信息 的 列 中 的 数据 时 ， 需 要 骨 
次 执行 RUNSTATS 命令 来 更 新 统计 信息 。 

在 DB2 V9.5 之 前 ， 因 为 RUNSTATS 仅 收 集 单 个 数据 库 分 区 的 统计 信息 ， 所 以 如 
朱 数 据 不 是 在 所 有 数据 库 分 区 中 一 致 分 发 的 ， 那 么 统计 信息 将 不 太 准 确 。 如 果 您 
怀疑 存在 不 一 致 的 数据 分 发 ， 那 么 您 可 能 想 要 在 执行 RUNSTATS 之 前 使 用 
REDISTRIBUTE DATABASE PARTITION GROUP 命令 来 在 各 数据 库 分 区 之 间 重 


您 可 以 通过 比较 得 询 RUNSTATS 之 前 和 之 后 的 SQL 语句 的 EXPLAIN 输出 ， 确 定 运 
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行 RUNSTATS 对 访问 计划 的 影 啊 。 

完成 每 一 条 RUNSTATS 语句 之 后 , 您 都 应 该 执行 显 式 的 COMMIT 命令 .COMMIT 将 
释放 锁 ， 并 避免 在 收集 多 个 表 的 统计 信息 时 填写 日 志 。 

在 用 RUNSTATS 收集 了 统计 信息 之 后 ， 要 使 用 BIND 命令 或 REBIND 命令 重新 绑 定 
包含 了 前 态 SQL 的 应 用 程序 包 ( 并 可 以 选择 重新 解释 其 语句 )。db2rbind 命令 可 用 于 重新 绑 
定数 据 库 中 的 所 有 应 用 程序 包 。 使 用 FLUSH PACKAGE 命令 来 删除 程序 包 绥 存 器 (package 
cache) 中 当前 所 有 绥 存 的 动态 SQL 语句 (db2 flush package cache dynamic), 并 强制 隐 式 地 编 
详 下 一 请 求 。 


8.2 ”上 自动 统计 信息 更 新 


DB2 优化 器 使 用 目录 统计 信息 来 确定 查询 的 最 佳 访 问 方案 。 过 期 或 者 不 完整 的 表 或 索引 统 
计 信 息 可 能 会 导致 优 化 器 选择 并 非 最 佳 的 方案 ， 从 而 导致 查询 执行 速度 下 降 。 但 是 ， 决 定 
要 为 给 定 的 工作 负载 收集 哪些 统计 信息 是 很 复杂 的 事情 ， 使 这 些 统计 信息 保持 最 新 也 是 一 
项 很 花费 时 间 的 任务 。DB2 提供 了 自动 收集 统计 信息 功能 (这 是 DB2 的 自动 表 维 护 功 能 处 
组 成 部 分 )，DB2 会 目 动 监视 表 和 定期 收集 活动 量 较 大 且 导 有致 统 计 信 息 更 改 的 表 的 统计 信 
上 县， 后 台 进 程 以 固定 的 时 间 间 隔 来 评估 表 的 活动 ， 决 定 是 不 是 需要 更 新 统计 信息 。 通 过 使 
用 自动 收集 统计 信息 功能 ,可 以 让 数据 库 管 理 器 确定 是 否 需 要 更 新 统计 信息 。DB2 还 提供 
了 实时 收集 统计 信息 功能 , 它 的 一 个 优点 是 当 SQL 提交 到 编译 器 时 , 优化 器 决定 表 的 统计 
信息 是 否 准确 。 如 果 不 准 确 ， 将 再 次 收集 统计 信息 。 也 就 是 说 ， 当 需要 表 统 计 信 息 来 优化 
和 运行 查询 时 ， 将 自动 收集 表 统 计 信 息 。 通 过 新 的 动态 配置 参数 auto_stmt stats 来 启用 实 
时 上 自动 收集 统计 信息 功能 。 


8.2.1 自动 RUNSTATS 的 基本 概念 
1. 自动 RUNSTATS 的 自动 收集 统计 信息 功能 


在 启用 自动 收集 统计 信息 功能 之 后 ， 每 隔 两 个 小 时 执行 一 次 异步 收集 统计 信息 检查 操 
作 。 判 断 是 否 需 要 收集 表 统计 信息 的 流程 图 如 图 8-1 所 示 。 
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8$ample the talle 


图 8-1 判断 是 否 需 要 收集 表 统 计 信 息 的 流程 


注意 : 

我 们 不 能 修改 UDI(UPDATE、DELETE、 INSERT) 的 比例 和 两 小 时 间隔 ,。 在 RUNSTATS 
执行 过 程 中 , 无 法 中 断 RUNSTATS 任务 , 除非 停止 实例 或 停 用 数据 库 . 为 了 避免 这 种 情况 
发 生 ， 我 们 最 好 在 数据 库 维 护 窗口 内 完成 RUNSTATS。 不 管 util impact lim( 影 响 策略 ) 设 
置 成 多 大 ， 自 动 RUNSTATS 始终 使 用 7% 的 固定 值 ， 


2. auto stmt_stats 自动 语句 统计 信息 


auto_stmt stats 参数 局 用 和 禁用 收集 实时 统计 信息 , 它 是 auto_runstats 配置 参数 的 于 参 
数 。 仅 当 父 auto_runstats 配置 参数 也 启用 时 ， 才 局 用 此 功能 。 在 OLTP 或 迁移 环境 中 ， 建 
议 将 该 参数 关闭 。 
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Automatic maintenance 
Automatic database backup 
Automatic table maintenance 

Automatic runstats 


(AUTO MAINT) = ON 
(AUTO DB BACKUP) = OFF 
(AUTO TBL MAINT) = ON 
(AUTO RUNSTATS)} = ON 

Automatic statement statistics (AUTO STMT STATS}) = OFF 
Automatic statistics profiling (AUTO STATS PROF) = OFF 

Automatic profile updates (AUTO PROF UPD) = OFF 
Automatic reorganization (AUTO REORG) = OFF 


3. health_mon 运行 状态 监视 器 


health mon 参数 是 用 来 根据 各 种 运行 状况 指示 上 喜来 收集 所 选 对 象 的 运行 状况 的 信息 ， 
而 真正 控制 自动 RUNSTATS 的 是 数据 库 参 数 auto runstats。 所 以 ， 当 health mon 关闭 而 
auto_runstats 打开 的 时 候 ， 上 月 动 RUNSTAIS 仍然 是 可 以 运行 的 。 反 过 来 ，health mon 打开 
而 auto runstats 关闭, 在 这 种 特殊 的 情况 下 , 目 动 RUNSTATS 会 处 于 仪 报告 (reporting-only) 
的 模式 。 不 管 自动 RUNSTATS 是 否 收集 表 的 统计 信息 , 监视 器 仍然 会 由 于 表 的 大 量变 化 而 
显示 该 表 需 要 章 新 收集 统计 信息 。 

4. 自动 维护 和 状态 监视 器 的 关系 


简 而 言 之 ， 数 据 库 配 置 控制 收集 信息 而 状态 监视 器 只 控制 报告 。 有 趣 的 是 ， 当 
health mon 关闭 而 auto runstats 打开 的 时 候 ， 自 动 RUNSTATS 会 收集 需要 统计 的 表 信 息 ， 
但 是 却 无 法 通过 状态 监视 喜报 告 收集 情况 。 不 过 ， 上 所 有 的 收集 统计 活动 都 会 记录 在 目录 
$HOME/sqllib/db2dumpy/events 下 轴 。 


5. 默认 的 RUNSTATS 命令 


runstats on table <inst>.<table> with distribution and sampled detalled 
indexes all 


另外 , 还 可 以 为 RUNSTATS 建立 统计 信息 的 配置 文件 。 统计 信息 配置 文件 是 指 一 组 选 
项 ， 它 预先 定义 了 特定 表 上 将 要 收集 的 统计 信息 。 当 将 命令 参数 “SET PROFILE” 添 加 到 
RUNSTATS 命令 时 ， 将 在 表 摘 述 符 和 系统 目录 中 注册 或 存储 统计 信息 配置 文件 。 


8.2.2 如何 打 开 auto_runstats 
1. 打开 自动 维护 开关 


为 了 设置 数据 库 目 动 进行 统计 信息 收集 ， 和 需要 为 目 动 维护 开关 设置 数据 库 配 置 参 数 。 
其 中 ，auto runstats、auto tbl maint 和 auto _ maint 必须 打开 ， 其 他 目 动 维护 参数 可 选 。 
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Automatic malntenance lauteo manty = on 
Automatic database backup (auto db backup) = off 
Automatic table maintenance (auto tbl maint} = on 

Automatic runstats (auto runstats} = on 
Automatic statement statistics (auto stmt stats)} = off 
Automatic statistics profiling (auto stats prof) = off 
Automatic profile updates (auto prof upd}) = off 
Automatic reorganization laaro reorg) “oF 


2. 打开 运行 状态 监视 器 (可 选 ) 


该 参数 是 用 来 收集 运行 状况 信息 的 ， 如果 你 关闭 了 该 参数 ， 就 无 法 通过 快照 命令 “db2 
get health snapshot for database on <db name>” 查 看 收集 到 的 信息 。 


db2 update dbmcfg using health mon on 
3. 创建 自动 维护 策略 文件 


在 日 录 <instance>/sqllib/tmp 下 创建 目 动 维护 条 上 略 文件 DB2AutoRunstatsPolicyxml， 访 
文件 可 用 来 指定 数据 库 管 理 器 应 如 何 执 行 目 动 表 RUNSTATS 操作 。 如 果 没 有 设置 , 默认 会 
对 包括 系统 表 在 内 的 所 有 表 执 行 目 动 表 RUNSTATS 操作 。 

配置 文件 中 需要 盾 写 的 条 件 是 来 目 SQL 语句 的 过 滤 条 件 ， 如 “select tabname from 


syscat.tables where <FilterCondition> 。 


<2xmMl version="1 0 encoding "UTF 8"23 
<DB2AUutoRunstatsPolicy 
xmlns="http://www.1ibm.com/xmlns/prod/db2/autonomic/conf1ig"> 
<RunstatsTableSscope> 

<FilterCcondition></FiltercCondition> 

</RunstatsTableSscope> 

</DB2AUutoRuNnstatsPolicy> 


4. 创建 目 动 维护 窗口 策略 文件 


在 目录 <instance>/sqllib/tmp 下 创建 DB2MaintenanceWindowPolicyxml， 访 文件 用 来 指 
定数 据 库 管理 磊 应 在 其 间 安 排 目 动 维护 的 维护 窗口 ， 默 认为 每 次 。 


<23Xml VerslLon="1.0" encoding="UTF-8"?> 

<DB2MaintenanceWindows 
xmlns="http://wwuw.1ibm.com/xmlns/prod/db2/autonomic/config"> 
<OnlineWindow Occurrence="During™" startTime="09:00:00™ duration="8"™"> 
<DaysOfWeek>All</DaysofWeek> 

<DaysOfMonth>All</DaysOofMonth> 
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<MonthsofYear>sAll</MonthsOfYeary> 
</OnlineWindow> 
</DB2MaintenanceWindows> 


5. 应 用 自动 维护 策略 


调用 系统 存储 过 程 automaint set policy 和 automaint set policyfile 来 为 数据 库 配 置 目 
动 维护 宁 上 略 。 
db2 "call 
syVSproc.automaint set policyfile('auto runstats", "DR2AUutoRumstatsPolicy. xml'}" 
db2 "call 


sysproc.automaint set policyfile('MAINTENANCE WINDOW','DB2MaintenanceWindow 
POLTICY Xm yr" 


6. 查看 自动 维护 策略 


调用 系统 存储 过 程 automaint get policy 和 automaint get policyfile 可 将 目 动 维护 策略 
复制 到 新 的 文件 中 。 
db2 "call 
sysproc.automaint get policyfile('auto runstats’', 'DB2AutoRunstatsPollcy 2.xml"')" 
db2 "call 
sysproc.automaint get policyfile('MAINTENANCE WINDOW','DB2MaintenanceWindow 
Bodie 2 Xm 


7. 检查 RUNSTATS 运行 状态 监视 器 
必须 打开 RUNSTATS 运行 状态 监视 器 才能 看 到 RUNSTATS 的 评估 报告 。 
db2 get alert config for database on <db name> 


8. 监控 当前 表 的 状态 


db2 get health snapshot for db on <db name> 
db2 get health snapshot for db on <db name> with full collection 


8.2.3 如 何 监控 auto_runstats 


为 了 解数 据 库 发 生 了 哪些 统计 信息 收集 活动 ，DB2 提供 了 统计 信息 日 记 。 统 计 信息 日 
志 记 录 数 据 库 的 所 有 统计 信息 活动 ， 包 括 目 动 和 手动 收集 统计 信息 。 统 计 信 息 日 志 的 默认 
名 称 为 db2optstats numberlog,， 它 位 于 $DIAGPATHVevents 目录 中 。 统 计 信 息 日 志 是 旋转 日 
志 。 统 计 信 息 日 志 行 为 由 db2 optstats log 注册 变量 控制 。 
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db2aet db2 ptstats 10g on mm NS (0 


除了 直接 查看 统计 信息 日 志 ， 还 可 以 通过 下 面 的 SQL 语句 可 以 查看 统计 信息 日 志 
的 内 容 : 


select pid, tid, 
substr (eventtype, 1, 10), 
substr (objtype, 1, 30) as objtype, 
substr (objname qualifier, 1, 20) as ob]jschema, 
substr (objname, 1, 10) as objname, 
substr (first eventqualifier, 1, 26) as eventl]l, 
substr(second eventqualifiertype, 1, 2) as event2 type, 
substrl(second eventqualifier, 1, 20) as event?2, 
substr (third eventqualifiertype, 1, 6) as event3 type, 
substr (third eventqualifier, 1, 15) as event3, 
substr(leventstate, 1, 20) as eventstate 

from table (sysproc.pd get diag hist 

( OpPEstatSs ， EX, NONE ， 

current timestamp - 1 year, cast (null as 七 Imestamp))) as sl1 

orgder by timestamp (varcharlisubstrifrst eventoqualifieri TT 26) 6 


通过 使 用 db2pd -tcbstats， 可 以 标识 对 表 执 行 UDI(UPDAT、DELETE 和 INSERT) 操 作 
的 次 数 。 

(a) New RTSUDI counter 是 指 从 上 一 次 收集 实时 统计 信息 、 异 步 收 集 统计 信息 或 手动 
收集 统计 信息 后 ， 增 删改 操作 的 次 数 。 

(b) Existing UDI counter 是 指 从 上 一 次 异步 收集 统计 信息 或 手动 收集 统计 信息 后 , 增删 
改 操作 的 次 数 。 

显示 绥 存 中 的 统计 信息 : 


db2pd -statisticscache summary | detail | find schema=<schema> obD]ect=<ob]ect> 


8.2.4 自动 收集 统计 视图 的 统计 信息 


在 DB2 V10 中 ， 通 过 打开 数据 库 参 数 auto_stats_views 可 以 目 动 收集 统计 视图 的 统计 
信息 。 有 时 , 为 了 提高 得 询 性 能 , 可 考虑 收集 更 高 级 的 统计 信息 ,例如 列 组 统计 信息 或 LIKE 
统计 信息 ， 或 者 创建 统计 视图 。 对 统计 视图 的 目 动 统 计 信 息 收 集 的 局 用 或 共用 通过 使 用 
auto_stats_views 数据 库 配 置 参 数 完成 。 默 认 情 况 下 ， 此 数据 库 配 置 参 数 为 OFF， 要 局 用 此 
功能 ， 请 发 出 以 下 命令 : 

update dbcfg for dbname using auto stats views on 


为 目 动 收集 统计 视图 的 统计 信息 而 上 友 出 的 命令 等 价 于 以 下 命令 : 
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runstats on view viewname with distribution 


注意 关键 字 是 view， 并 非 table， 该 参数 是 DB2 V10 中 新 增加 的 。 


8.3” 颂 片 整理 


随 看 数据 的 人 不断 删除 、 插 入 和 更 新 ， 数 据 页 和 索引 页 会 变 得 越 来 越 考 敌 ， 数 据 页 和 过 
引 页 的 物理 存储 顺序 不 再 匹配 其 逻辑 顺序 ， 数 据 和 索引 结构 的 层次 会 变 得 过 大 ， 这 些 部 会 
导致 数据 页 路 越 在 多 个 页 上 和 索引 页 的 预 谈 取 变 得 效率 低下 。 因 此 ， 需 要 根据 数据 蝎 新 的 
频 震 程度 适当 地 重新 组 织 表 和 索引 。 


8.3.1 碎片 产生 机 制 和 影响 


对 表 数 据 进行 大 量 更 改 之 后 ， 罗 辑 上 连续 的 数据 可 能 被 分 散 存 放 在 很 多 个 不 连续 的 物 
理 数据 页 中 ， 因 此 数据 库 管理 器 必须 执行 更 多 的 读 操作 来 访问 数据 。 另 外 ， 对 某 个 表 删 除 
大 量 行 后 ， 由 于 表 的 高 水 位 标记 并 不 会 发 生变 化 ， 因 此 对 该 表 进 行 全 表 扫描 时 就 会 出 现 很 
多 不 必要 的 IO 操作 。 在 这 样 的 情况 下 ， 您 可 以 考虑 重组 表 以 回收 浪费 的 空间 和 对 数据 进 
行 重组 。 此 时 ， 既 可 重组 系统 目录 表 ， 也 可 以 重组 数据 库 表 。 


提示 : 

由 于 重组 表 的 时 间 通 常 要 比 运行 统计 信息 的 时 间 长 ,因此 您 可 以 执行 RUNSTATS 以 更 
新 当前 的 数据 统计 信息 并 重新 绑 定 应 用 程序 。 如 果 更 新 的 统计 信息 并 没有 改善 性 能 ， 那 么 
重组 可 能 会 有 所 帮助 。 


通过 删除 和 插入 操作 对 表 进 行 更 新 后 ， 索 引 的 性 能 会 降低 ， 其 表现 形式 如 下 : 
e 索引 叶子 页 分 裂 。 叶 子 页 被 分 裂 之 后 ， 由 于 必须 读 取 更 多 的 叶子 页 才能 访 存 表 页 ， 
因此 LO 操作 成 本 会 增加 。 
e 物理 索引 页 的 顺序 不 再 与 这 些 页 上 的 键 顺序 相 匹 配 ( 此 称 为 不 良 集群 索引 )。 叶子 页 
出 现 不 展 集群 情况 后 ， 顺 序 预 取 操 作 的 效率 将 降低 ， 因 此 会 导致 更 多 的 IO 等 每 。 
e 形成 的 索引 大 于 其 最 有 效 的 级 别 (leveD) 数 。 在 此 情况 下 应 重组 索引 。 
如 果 在 创建 索引 时 设置 了 MINPCTUSED 参数 ， 那 么 在 删除 某 个 键 且 可 用 空间 小 于 指 
定 的 百分比 时 ， 数 据 库 服务 器 会 目 动 合并 索引 叶子 页 。 此 过 程 称 为 联机 索引 整理 碎片 。 但 
是 ， 要 复原 索引 集群 和 可 用 空间 以 及 降低 索引 叶 级 别 ， 请 使 用 下 列 其 中 一 种 方法 : 
e 删除 并 重新 创建 索引 。 
e 使 用 REORG INDEXES 命令 联机 重组 索引 。 因 为 此 方法 允许 用 户 在 重建 表 索 引 期 
间 对 表 进 行 读 写 操作 ， 所 以 在 生产 环境 中 可 能 需要 选择 此 方法 。 
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e 使 用 允许 脱 机 重组 表 及 其 索引 的 选项 运行 REORG TABLE 命令 。 
8.3.2 确定 何 时 重组 表 和 索引 


在 对 表 数 据 进行 许多 更 改 之 后 ， 逻 辑 上 连续 的 数据 可 能 会 位 于 不 连续 的 物理 数据 页 
上 ， 当 许多 更 新 操作 创建 了 溢出 (overflow) 记 录 时 更 是 如 此 。 按 这 种 方式 组 织 数据 时 ， 数 据 
库 管 理 器 必须 执行 额外 的 读 操 作 才能 访问 顺序 数据 。 另 外 ， 在 删除 大 量 数据 后 ， 空 间 并 没 
有 释放 ， 也 需要 执行 额外 的 读 操 作 。 

表 重 组 操作 会 通过 整理 数据 碎片 来 减少 滔 费 的 空间 ， 并 对 行进 行 重 新 排序 以 合并 游 出 
记录 ， 从 而 加 快 数据 访问 速度 并 最 终 提高 查询 性 能 。 还 可 以 指定 根据 特定 索引 来 重新 排序 
数据 ， 以 便 查询 能 通过 最 少 的 IO 读 取 操作 就 可 以 访问 数据 。 

对 表 数 据 进行 大 量 更 改 将 导致 更 新 察 引 并 使 索引 性 能 下 降 。 款 引 叶 子 页 可 能 变 成 碎 乒 
或 出 现 不 良 集群 情况 ， 并 且 索 引 有 可 能 形成 比 所 需 层 次 (level) 要 多 的 层次 以 获得 最 佳 性 能 
(通常 ， 几 百 万 条 记录 的 索引 层次 一 般 为 3， 正 常生 产 环 境 中 索引 的 层次 很 少 超过 4)。 所 有 
这 些 问题 都 会 产生 更 多 LO 并 导致 性 能 下 降 。 

下 列 任何 情况 都 需要 我 们 重组 表 或 索引 ; 

e 自 上 次 重组 表 之 后 ， 对 查询 访问 的 表 进行 了 大 量 的 插入 、 更 新 和 删除 活动 。 

e 对 于 使 用 具有 高 聚合 度 的 索引 的 查询 ， 其 性 能 发 生 了 明显 变化 。 

e 在 执行 RUNSTATS 以 刷新 统计 信息 后 ， 性 能 没有 得 到 改善 。 

。 REORGCHK 命令 指示 需要 重组 表 或 索引 (注意 : 在 某 些 情况 下 , REORGCHK 始终 
建议 重组 表 ， 即 使 在 执行 了 重组 后 也 是 如 此 )。 人 例如， 如果 使 用 32KB 页 大 小 ， 并 
且 平 均 记 录 长 度 为 15 字 贡 且 每 页 最 多 包含 253 条 记录 ， 那 么 每 页 具有 32700 - (15 
x 253)=28905 个 不 可 用 罕 节 。 这 和 意味 看 大 约 88% 的 页 面 是 可 用 空间 。 有 用户 应 分 析 
REORGCHK 的 建议 并 针对 执行 重组 所 需 的 成 本 平衡 利益 。 

e 综合 考虑 因 查 询 性 能 不 断 降 低 浪 费 的 成 本 和 重组 表 所 需 的 成 本 (包括 CPU 时 间 、 重 
组 的 时 间 和 REORG 实用 程序 在 完成 重组 操作 之 前 锁定 表 所 造成 的 并 行 性 降低 )， 
以 确定 是 否 进行 表 重 组 。 

要 确定 是 否 需要 重组 表 或 索引 ， 碍 询 系统 目录 表 中 的 统计 信息 并 监视 下 列 统计 信 息 ; 


行 的 溢出 ( 行 链 接 ) 

查询 SYSSTAT.TABLES 视图 中 的 OVERFLOW 列 以 监视 洲 出 值 。 当 表 中 的 可 变 长 虐 
列 导 致 记录 长 度 变 长 ， 以 致 它们 不 能 放 入 数据 页 上 的 指定 位 置 时 ， 行 数据 束 会 洲 出 。 在 列 
添加 全 表 定 义 并 稍 后 通过 更 新 行 来 更 新 该 列 时 ， 长 度 也 可 能 会 更 改 。 在 这 种 情况 下 ， 行 中 
的 原始 位 置 将 你 留 一 个 指针 ， 而 实际 值 存储 在 由 指针 指示 的 态 一 个 位 置 。 这 可 能 会 影响 性 
能 ， 因 为 数据 库 管 理 需 必须 根据 指针 来 租 找 行 的 内 容 。 这 个 包括 两 个 步骤 的 过 程 增加 了 处 
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理 时 间 ， 并 且 还 会 增加 需要 的 IJO 数目 。 
重组 表 数 据 将 消除 行 洲 出 ; 如 果 行 链接 数量 较 多 ， 睾 组 表 数 据 的 效果 就 会 比较 明显 。 


访 存 统计 信息 
当 以 索引 顺序 访问 表 时 ， 查 询 SYSCATINDEXES 和 SYSSTATINDEXES 系统 目录 表 
中 的 以 下 3 个 列 来 确定 预 取 程序 的 效率 。 对 照 这 些 统计 信息 和 基 表 来 体现 预 取 程序 的 平均 
性 能 的 特征 。 
e。 AVERAGE SEQUENCE FETCH PAGES 列 存储 可 以 按 表 中 的 顺序 访问 的 平均 页 
数 。 可 以 按 顺 序 访问 的 页 适合 于 预 取 。 较 小 的 数目 指示 预 取 程序 没有 充分 发 挥 作 
用 ， 原因 是 它们 不 能 读 入 由 表 空 间 的 预 取 大 小 设置 指定 的 所 有 页 数 。 较 大 的 数 指 
示 预 取 程序 将 有 效 地 执行 。 对 于 集群 索引 和 表 ， 此 数目 应 该 接近 NPAGES( 包 含 一 
些 行 的 页 数 ) 的 值 。 
e AVERAGE RANDOM FETCH PAGES 列 存储 当 使 用 索引 来 访 存 表 行 时 在 顺序 页 
访问 之 间 的 平均 随机 表 页 数 。 当 大 多 数 页 按 顺 序 排列 时 ， 预 取 程 序 忽 略 少 量 的 随 
机 页 ， 并 按 已 配置 的 预 取 大 小 继续 预 取 。 当 表 变 得 更 加 混乱 时 ， 随 机 访 存 页 数 就 
ep 通 凋 是 由 于 在 表 的 末尾 或 在 溢出 页 中 发 生 了 无 序 的 插入 而 导致 这 样 的 无 
昌 织 。 当 使 用 索引 来 访问 某 一 范围 内 的 值 时 ， 这 会 导致 降低 碍 询 性 能 的 访 存 。 
e AVERAGE SEQUENCE FETCH GAP 列 存储 当 使 用 索引 进行 访 存 时 表 页 序列 之 
间 的 平均 则 隔 。 通 过 扫描 索引 叶子 页 来 进行 检测 ， 每 个 间隔 表示 在 表 页 的 各 个 序 
列 之 则 必须 随机 访 存 的 平均 表 页 数 。 当 随机 访问 许多 页 时 发 生 这 些 情况 ， 这 会 中 
靳 了 预 取 程 序 。 较 大 的 数 指示 无 组 织 的 表 或 较 莽 集群 的 守 3 引 |。 


包含 标记 为 已 删除 但 未 除去 的 RID 的 索引 叶子 页 数 

在 type-2 类 型 索引 中 ， 当 RID 标记 为 删除 时 ， 通 常 未 在 物理 上 删除 RID。 这 意味 着 可 
用 空间 可 能 会 被 这 些 馆 辑 上 已 删除 的 RID 占用 。 要 检索 每 个 RID 部 被 标记 为 已 删除 的 叶子 
页 的 数目 ， 查 询 SYSCATINDEXES 和 SYSSTATINDEXES 统计 信息 表 的 
NUM EMPTY LEAFS 列 。 对 于 并 非 所 有 RID 都 标记 为 删除 的 叶子 页 ， 逻 辑 上 已 删除 的 
RID 的 总 数 存储 在 NUMRIDS DELETED 列 中 。 

使 用 此 信息 来 通过 执行 带 CLEANUP ALL 选项 的 REORG INDEXES 估计 可 以 回收 


多 少 空间 。 要 想 上 只 回收 所 有 RID 都 被 标记 为 已 删除 的 页 中 的 空间 ， 执 行 市 有 CLEANUP 


ONLY PAGES 达 项 的 REORG INDEXES 。 


索引 的 聚合 比率 和 聚合 因子 统计 信息 
聚合 比率 统计 信息 存储 在 SYSTCATINDEXES 系统 目录 表 的 CLUSTERRAIIO 列 中 。 


365 


366 


DB2 数据 库 性 能 调整 和 优化 (第 3 版 ) 


此 值 (在 0 到 100 之 间 ) 表 示 使 用 索引 的 数据 聚合 的 程度 。 如 果 收 集 DETAILED 索引 统计 信 
县 0 和 1 之 间 的 好 的 聚合 因子 统计 信息 存储 在 CLUSTERFACTOR 列 中 ， 并 且 
CLUSTERRATIOQ 的 租 为 了， 那么 这 两 个 集 辞 统计 信息 中 具有 一 个 可 以 记录 在 
SYSCATINDEXES 目录 表 中 。 要 将 CLUSTERFACTOR 值 与 CLUSTERRATIO 值 进行 比较 ， 
可 以 将 CLUSTERFACTOR 乘 以 100 以 获得 百分比 。 


注意 : 

通常 ， 表 中 只 有 一 个 索引 可 以 具有 较 高 的 聚合 度 ， 

如 条 合 询 用 到 的 索引 需要 访问 表 中 比较 多 的 数据 ， 而 不 是 只 访问 索引 或 者 只 通过 唯一 
索引 访问 表 的 一 条 记录 ， 那 么 在 具有 较 亏 聚合 比率 的 情况 下 可 能 执行 得 更 好 。 低 的 聚合 上 度 
导致 此 关 扫 拍 归 执行 更 多 的 IJO， 因 为 在 每 个 数据 页 经 过 第 一 次 访问 后 ， 下 放 访问 该 册 时 ， 
该 页 仍 在 缓冲 池 中 的 可 能 性 减 小 。 增 大 绥 冲 池 大 小 也 可 以 提 局 非 案 合 索引 的 性 能 。 

如 果 表 数据 最 初 是 针对 东 个 索引 聚合 的 ， 和 而 集群 统计 信息 指示 现在 很 少 为 同一 索引 桶 
合 数据 ， 那 么 您 可 能 想 重 组 该 表 以 再 次 聚合 数据 。 


索引 叶子 页 数 
查询 SYSCAT.INDEXES 表 中 的 NLEAF 列 ， 以 便 了 解 索引 占用 的 叶子 页 数目 。 该 数目 
告诉 您 对 索引 进行 完整 扫描 需要 多 少 索引 页 IO。 


理想 情况 下 , 索引 应 该 尽 可 能 占用 最 小 的 空间 量 , 以 便 减少 进行 索引 扫描 所 需要 的 IO 
次 数 。 随 机 的 更 新 活动 可 导 人 臻 页 分 割 ， 这 整 增 大 了 索引 的 大 小 。 当 在 重组 表 期 间 和 蕴 建 守 引 
时 ， 可 以 使 用 最 小 空间 量 来 构建 每 个 索引 。 


注意 : 
默认 情况 下 ， 当 构建 索引 时 ， 会 在 每 个 索引 页 上 保留 10% 的 可 用 空间 。 要 增加 可 用 空 
间 量 ， 当 创建 索引 时 指定 PCTFREE 参数 。 无 论 何 时 重组 索引 ， 都 使 用 PCTFREE 值 . 


空 数 据 页 的 数目 

要 计算 表 中 的 碎片 数 ， 查 询 SYSCAT TABLES 中 的 FPAGES 和 NPAGES 列 ， 并 从 
FPAGES 数 减 去 NPAGES 数 。FPAGES 列 存储 正在 使 用 的 总 页 数 ，NPAGES 列 存 储 包含 一 
些 行 的 页 数 。 当 删除 整个 范围 内 的 行 时 ， 可 能 出 现 空 页 。 

随 着 碎片 的 增多 ,就 更 需要 进行 表 重 组 。 重 组 表 时 将 回收 碎片 并 减少 表 使 用 的 空间 量 。 
另外 ， 因 为 会 将 碎片 的 数据 页 读 入 绥 冲 池 以 进行 表 扫 描 ， 所 以 回收 未 使 用 的 页 可 以 提高 表 
扫描 的 性 能 。 
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8.3.3 执行 表 、 索 引 检 查 是 否 需要 做 REORG 


reorgchk 命令 返回 有 关 数 据 组 织 的 统计 信息 ， 并 且 可 以 在 是 否 需 要 重组 特定 表 或 索引 
这 一 问题 上 为 您 提供 建议 。 以 下 为 reorgchk 命令 的 输出 : 


db2 reorgchk update statistics on table db21nstl .emp1Loyee 

执行 RUNSTATS 

表 统 计 信 息 : 

Fl: 100 * OVERFLOW / CARD < 5 

F2: 100 * (Effective Space Ut1ilization of Data Pages) > 70 

F3: 100 * (Required Pages / Total Pages}) > 80 

SCHEMA NAME, CARD OV NP FP ACTBLK TSI2E EL F2 F3 REORG 

DB2INST1] EMPLOYEE 298500 55163939 12932 1l16165 

有 

索引 统计 信息 : 

F4: CLUSTERRATIO 或 正名 化 的 CLUSTERFACTOR > 80 

FE 100 区 本 交合 * (ISTZ2E TT 9 YT [CARD EEYS) 9) YY CINLEAF — NUM EMPTY 
LEAFS) * INDEXPAGESIZE) > 20 

FG T1100 “PCTEREREY {iINDOEXPAGESTZE 96) PM({ITSTZAZE 1 EV 
2 (INOEXPAGESTZE O66 A EEYS * CISTZE TT 9 oARD EEYSY 3) 100 

Fi1: 100 * (NUMRIDS DELETED / (NUMRIDS DELETED + CARD)) < 20 

F8: 100 * (NUM EMPTY LEAFS / NLEAF) < 20 

SCHEMA NAME, CARD LEAF ELEAF LVLS 
ISlaE, NDEL KEYS F4 FS F6 Fi/ F8 REORG 


表 : DB2INST]1 .EMPLOYEE 


DB2INST1 IDX EMP C 228200 14894 0 4 106 21040 
Ba00 FF2 .48 :3 | 0 
SYSIBM SQELO604T T152213950 258500 722 0 4 60 0 


8300 2°"6E 62 0 Oe 


在 上 面 的 输出 中 , 我 们 重点 关注 “REORG” 字 段 。 如 果 REORG 字段 有 一 个 或 多 个 “*”， 
那么 可 以 考虑 对 该 表 或 索引 重组 。 

使 用 ORGANIZE BY 子 名 和 相应 的 维 索 引 定 义 的 表 的 名 称 有 * 后 级 。 维 索引 的 基数 等 
价 于 表 的 “活动 的 块 数 ” 统 计 信 息 。 

在 草 组 之 前 ， 请 综合 考虑 因 伍 询 性 能 不 断 降低 浪费 的 成 本 和 重组 表 或 索引 所 壳 的 成 本 
(包括 CPU 时 间 、 耗 用 时 间 和 REORG 命令 在 完成 重组 操作 之 前 锁定 表 霹 成 的 并 行 性 降低 )， 
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以 确定 是 否 进行 表 重 组 。 


DB2 提示 信息 说 明 

对 reorgchk 命令 使 用 的 度量 的 考虑 因素 包括 ( 当 但 看 reorgchk 工具 的 输出 时 ， 找 到 用 
于 表 的 Fl、F2 和 F3 这 几 列 ， 以 及 用 于 索引 的 F4、F5、F6、F7 和 F8 这 几 列 。 如 果 这 些 
列 中 的 任何 一 列 有 星 号 (*)， 束 说 明 当 前 的 表 和 /或 案 引 应 该 重组 ): 

Fl: 属于 洲 出 记录 的 行 所 占 的 百分比 。 当 这 个 白 分 比 大 于 5% 时 ， 在 输出 的 Fl 列 中 将 
有 一 个 星 号 (*)。 

F2: 数据 页 中 使 用 了 的 空间 所 占 的 百分比 。 当 这 个 百分比 小 于 70%( 也 就 是 说 有 30% 
左右 的 碎片 ) 时 ， 在 输出 的 F2 列 上 将 有 一 个 星 号 (*)。 

F3: 其 中 含有 包含 菜 些 记录 的 数据 的 页 所 占 的 百分比 。 当 这 个 百分比 小 于 80% 时 ， 在 
输出 的 F3 列 上 将 有 一 个 星 号 (*)。 

F4: 群集 率 ， 即 表 中 与 索引 具有 相同 顺序 的 行 所 占 的 百分比 。 当 这 个 百分比 小 于 80% 
时 ， 在 输出 的 F4 列 上 将 有 一 个 星 号 (*)。 指 示 索 引 需 要 REORG, 该 索引 与 基本 表 不 在 相同 
的 序列 中 。 当 在 表 中 定义 了 多 个 索引 时 ， 一 个 或 多 个 索引 可 能 被 标记 为 需要 REORG。 指 
定 REORG 顺序 的 最 重要 索引 。 

F$: 在 每 个 索引 页 上 用 于 索引 键 的 空间 所 占 的 百分比 。 当 这 个 百分比 小 于 $0% 时 ， 在 
输出 的 FS 列 上 将 有 一 个 星 号 (*)。 

F6: 可 以 存储 在 每 个 索引 级 的 键 的 数目 。 当 这 个 数字 小 于 100 时 ， 在 输出 的 F6 列 上 
将 有 一 个 星 号 (*)。 

F7: 在 一 个 页 中 被 标记 为 deleted 的 记录 ID( 键 ) 所 占 的 百分比 。 当 这 个 百分比 大 于 20% 
时 ， 在 输出 的 F7 列 上 将 有 一 个 星 号 (*)。 

F8: 索引 中 罕 叶 子 页 所 占 的 百分比 。 当 这 个 百分比 大 于 20% 时 ， 在 输出 的 F8 列 上 将 
有 一 个 星 号 (*)。 

提示 : 

在 有 具体 的 生产 实践 中 ，reorgchk 命令 的 返回 结果 可 以 作为 是 否 需 要 REORG 的 参考 依 
据 ， 但 是 并 不 能 作为 唯一 的 依据 ， 具 体 是 否 需 要 做 REORG， 还 要 根据 表 的 实际 业务 行为 
做 具体 情况 分 析 。 


8.3.4 REORG 的 用 法 和 使 用 策略 


REORG 命令 的 语法 如 下 : 
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re 一 REIRG 


TABLE—toble-nome— Jable Clause 
mos ALL FOR TABLE—toble-nam Index Clause ] 


INDEX—index-name 
FOR TABLE—taoble-nome— 


> 二 
Database Partition Clause 


Table Clause: 


[MODE Ni—inder- iG 


KEEPDICTILONARY. 
LLOWN NO ALLESS—S -UsE—tbspoce=nome —INDEX SCAN— LONGLDOBDATA————— -RESETOICTIONARYS 
ALLOW READ ACCES SE—iongthspoce=nome. 
LLOW WRITE ACCES START 
LINPLACE -十 一 二 - 
LLON READ ACCESS OTRUNGATE TABLE RESUME 
TOR 
PAUSE: 


Index Clause: 


ALLOW NO ACCESSO—— ALL——o— 
ALLOW WRITE ACCES. CLEANUP ONLY 
ALLOW READ ACCES PAGES 
CONVERT 


Database Partition Clause: 


BPARTI TIONNUM To—db-portition-numbere 
DBPARTI TIONNUMS 


EXCEPT: ae hn HE 
DEPARTITIONNU 


Toomerimiom 有 
ALL 


TO—db-portition-number2 


几 个 币 用 选项 : 
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e USE tbspace-name: 指定 用 来 进行 REORG 的 系统 临时 表 空 间 ， 如 果 不 指 定 的 话 ， 
会 使 用 当前 表 所 在 的 表 空 间 ， 表 比较 大 的 话 有 可 能 造成 该 表 空 间 使 用 率 达 到 
100%， 影 响 其 他 表 的 访问 

e RESETDICTIONARY: 针对 具有 压缩 属性 的 表 进 行 压 缩 字 典 重 建 。 

e KEEP DICTIONARY: 针对 压缩 字典 的 表 不 进行 压缩 字典 重建 。 

e INPLACE: 指明 需要 使 用 联机 重组 。 

DB2 提供 了 在 线 或 离线 执行 REORG 的 选项 。 默 认 情 况 下 ， 离 线 REORG 允许 其 他 用 
户 谈 这 个 表 ，ALLOW READ ACCESS 是 默认 选项 。 可 以 通过 指定 ALLOW NO ACCESS 
选项 来 限制 对 表 的 访问 。 肪 机 表 重 组 包括 4 个 阶段 ， 可 以 使 用 db2pd -db dbname -reorgs 命 
令 来 二 看 。 

1) 排序 (scan-sort): 如 果 索 引 是 使 用 REORG TABLE 命令 指定 的 , 或 者 如 果 对 表 定 义 
了 集群 索引 ， 那 么 首先 根据 该 索引 对 表 行 进行 排序 。 如 果 指 定 了 INDEXSCAN 选项 ， 那 
么 使 用 索引 扫描 对 表 进 行 排序 ; 否则， 使 用 表 扫 描 排序 。 

2) 构建 (build): 在 此 阶段 ,将 在 要 重组 的 表 押 在 的 表 空 间 中 或 使 用 REORG 命令 指定 
的 临时 表 空 间 中 构建 整个 表 的 已 重组 副本 。 

3) 符 换 人 (replace): 在 此 阶段 ， 通 过 从 临时 表 空 间 中 复制 回 表 对 象 或 通过 在 表 所 在 的 表 
空间 中 构建 的 对 象 来 登 换 原 始 表 对 象 。 

4) 重新 创建 所 有 过 51(Index Recreate): 重新 创建 在 表 上 定义 的 所 有 索引 | 。 

在 线 REORG (也 称 inplace REORG) 文 持 对 表 的 谈 或 写 访 问 ,ALLOW WRITE ACCESS 
是 默认 选项 。 

表 8-2 是 脱 机 重组 和 联机 重组 的 比较 结果 。 


表 8-2 脱 机 重组 与 联机 重组 的 比较 
特征 联机 重组 
完成 时 数据 的 集群 因子 上 最 佳 集群 
并 行 性 (对 表 的 访问 ) ALLOW NO ACCESS ALLOW READ ACCESS 
ALLOW READ ACCESS( 默 认 ) | ALLOW WRITE ACCESS (默认 ) 


数据 存储 空间 要 求 不 是 非常 大 


日 志 记 录 存 储 空间 要 求 个 古 非常 大 上 E 疝 大 
用 户 控制 ( 暂 俘 和 重新 司 动 重 | 较 少 控 制 物 多 控制 
组 过 程 的 能 力 ) 

可 恢复 性 完全 可 恢复 或 完全 不 可 恢复 : 可 恢复 


成 功 或 失败 


第 8 章 统计 信息 更 新 与 碎片 整理 


( 续 表 ) 
特征 联机 重组 

索引 重建 进行 不 进行 

支持 所 有 类 型 的 表 和 

指定 除 集群 索引 外 的 索引 否 

使 用 临时 表 空 间 下 


DB2 V9.7 引入 了 新 的 特性 ， 可 以 对 分 区 表 的 单个 分 区 进行 表 和 索引 重组 ， 这 个 新 特性 
使 得 用 户 可 以 仅 对 茶 个 分 区 进行 重组 ， 并 仅 在 该 分 区 上 对 其 他 事务 的 读 写 权限 进行 限制 。 
这 样 可 以 最 大 程度 地 缩小 重组 命令 对 其 他 事务 的 影响 ， 提 高 事务 的 并 发 度 。 这 样 当 用 户 使 
用 分 区 重组 时 ， 在 表 上 没有 非 分 区 索引 的 情况 下 ， 重 组 命令 将 完全 只 在 一 个 分 区 上 进行 ， 
从 而 对 其 他 分 区 上 的 事务 没有 任何 影响 。 相 关 的 选项 如 下 : 


>>-REORG- 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 > 


Table partitioning clause 
ON DATS PADTLEEION oarctr ton TG | 


对 于 生产 数据 库 ， 如 果 有 运 维 时 间 窗 口 ， 建 议 执 行 离线 REORG， 并 且 在 执行 离线 
REORG 时 使 用 临时 表 空 间 (USE tbspace-name)。 对 于 没有 运 维 时 间 窗 口 的 ， 可 以 尝试 做 
在 线 REORG， 但 是 因为 在 线 REORG 的 时 间 会 特别 长 ， 所 以 需要 人 为 控制 ， 避 开业 务 高 
峰 期 。 


8.4 重新 绑 定 程序 包 


重新 绑 定 (rebingd) 是 为 先前 绑 定 的 应 用 程序 重新 创建 程序 包 的 过 程 。 每 个 在 数据 库 中 执 
行 的 应 用 程序 在 执行 乙 前 都 需要 有 一 个 绑 定 过 程 ， 这 个 绑 定 过 程 会 根据 数据 库 中 各 种 统计 
信息 和 相关 数据 库 对 象 的 情况 创建 一 个 程序 包 ， 这 个 程序 包 中 通常 就 是 执行 计划 。 所 以 在 
统计 信息 或 相关 数据 库 对 象 被 修改 之 后 ， 束 需要 对 数据 库 中 受 影 啊 的 应 用 程序 执行 章 新 绑 
定 ， 这 样 才能 允许 应 用 程序 使 用 最 新 的 更 新 。 

那么 具体 哪些 程序 包 必 须 执 行 重 新 绑 定 呢 ? DB2 的 系统 表 SYSCAT.PACKAGES 的 
VALID 列 标识 当前 的 程序 包 是 否 可 用 ， 如 果 此 列 的 值 为 “X”， 吏 表示 当前 的 程序 包 是 不 
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可 用 的 ， 此 程序 包 束 需要 被 重新 绑 定 。 这 些 程序 包 可 以 使 用 下 面 的 方法 进行 绑 定 ， 也 可 以 
让 数据 库 管 理 器 在 执行 这 样 的 程序 包 的 时 候 目 动 地 完成 重新 绑 定 (数据 库 管 理 需 默认 在 隐 
式 执 行 这些 不 可 用 的 程序 包 的 时 候 重 新 将 它们 绑 定 )。 
建议 在 对 统计 信息 更 新 之 后 对 数据 库 中 的 应 用 程序 执行 重新 绑 定 ， 以 更 新 执行 计划 。 
还 有 一 些 其 他 情况 需要 及 时 地 重新 绑 定 程序 包 ， 比 如 创建 了 新 的 索引 等 。 统 计 信 息 更 新 、 
俊 厂 整理 和 rebind 的 顺序 如 图 8-2 所 示 。 
统计 信息 更 新 


图 8-2 ”统计 信息 更 新 和 碎片 整理 的 处 理 流程 


有 两 个 命令 可 以 执行 重新 绑 定 : 
® rebmd 
® db2rbimd 


rebind 命令 


rebind 命令 可 以 重新 创建 数据 库 中 己 经 存在 的 程序 包 。 具 体 的 语法 如 下 : 


> Tobind 1 he le 
“PACENGE 
Ne 下 人 人 
-VERSION--VerslLon-name-" ‘CONSERVATIVE—" 
一 一 一 ~- 让 = 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 < 


+t—REOPT NUNE 一 一 一 十 
到 二 REQPT NG = 
"REQOPT ALWAYS— 


db2rbind 命令 
db2rbind 命令 可 以 重新 绑 定 数据 库 中 存在 的 所 有 的 程序 包 。 有 基体 语法 如 下 : 
>>-db2rbind database™— “| = 109gf1ilO 1 和 > 
一己] 工 - 
> 一 一 十 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 十 一 一 十 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 十 一 一 一 > 芯 
er DD “DdsSSworgd | .—Conservative—. | 
2 4a 


此 命令 的 功能 类 似 于 rebind， 只 是 更 简单 一 些 ， 而 且 可 以 批量 地 处 理 数据 库 中 所 有 的 
程序 包 。 
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8.5 本章 小 结 


当 数 据 库 运行 了 较 长 时 间 之 后 ， 随 着 数据 的 变化 或 增长 ， 数 据 库 中 的 应 用 会 变 得 越 来 
越 慢 ， 我 们 就 不 得 不 对 数据 库 进行 统计 信息 更 新 、 肆 片 整 理 和 rebind 以 提高 应 用 的 性 能 。 
而 且 通 常会 一 起 考虑 执行 ， 并 且 应 该 遵循 图 8-3 所 示 的 处 理 流 程 。 


RUNSTATS REURCLHK = 


Re org needed? 


Application 
execut ion 


图 8-3 ”统计 信息 更 新 和 碎片 整理 的 处 理 流程 


首先 使 用 用 于 统计 信息 更 新 的 RUNSTATS 工具 更 新 相关 数据 库 对 象 的 统计 信息 ,然后 
使 用 数据 库 的 REORG 重组 工具 对 数据 库 的 碎片 进行 处 理 , 接 看 由 使 用 RUNSTATS 工具 对 
数据 库 的 统计 信息 进行 更 新 ， 最 后 将 数据 库 中 相关 的 程序 包 重 新 绑 定 。 这 样 就 完成 了 一 个 
完整 的 统计 更 新 和 碎片 整理 的 过 程 。 在 经 过 一 定 的 时 间 周 期 后 (一 周 、 一 个 月 或 其 他 时 间 )， 
再 人 次 完成 上 面 描述 的 完整 过 程 。 这 样 在 数据 库 中 访问 数据 的 效率 会 得 到 及 时 更 新 。 

那么 上 述 循环 过 程 的 执行 频率 应 该 是 何 种 频率 呢 ? 答案 是 : 不 一 定 。 这 需要 根据 实际 
情况 来 确定 。 最 重要 的 就 是 我 们 要 明确 上 述 过 程 的 最 终 目标 是 什么 ?” 上述 过 程 的 最 终 目 标 
就 是 将 数据 库 中 数据 的 变化 反映 出 来 并 让 数据 库 做 出 相应 的 调整 。 所 以 数据 库 中 数据 变化 
得 越 快 ， 上 述 过 程 的 频率 就 应 该 越 蜗 ， 相 反 ， 数 据 库 中 数据 变化 得 越 慢 ， 上 述 过 程 的 频率 
也 整 越 低 。 如 果 数 据 库 中 的 数据 没有 变化 ， 那 么 我 们 其 至 不 需要 执行 上 述 过 程 。 还 有 个 需 
要 关注 的 因素 就 是 时 间 窗 口 ， 实 际 的 应 用 程序 是 否 能 够 为 我 们 执行 上 述 过 程 留 出 足够 的 时 
间 窗 口 。 比 如 ,对 于 5X24(5 天 X24 小 时 ) 的 应 用 ， 那 么 平时 是 没有 时 间 窗 口 让 我 们 来 完成 
上 述 过 程 的 。 这 些 工 作 只 能 放 到 周末 去 执行 。 所 以 最 终 采 用 何 种 频率 来 完成 上 面 的 过 程 ， 
是 由 上 面 的 两 方面 因素 共同 决定 的 。 
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对 于 数据 库 管理 员 而 言 ， 调 优 数 据 库 由 于 可 能 涉及 各 方面 的 问题 ， 上 到 应 用 软件 ， 下 
到 操作 系统 、 存 储 等 ， 有 时候 还 会 涉及 网 络 ， 因 此 这 是 一 项 复杂 而 极 具 挑 战 的 工作 。 尽 管 
复杂 ， 但 是 大 多 情况 下 瓶颈 都 在 一 个 点 上 ， 调 优 应 用 程序 就 是 一 种 有 效 的 方法 ， 但 在 大 多 
数 生 产 系 统 中 ，DBA 很 少 甚至 不 能 更 改 应 用 程序 源 代 码 ， 因 此 限制 了 他 们 调 优 应 用 程序 
的 能 力 。 通 党 最 有 效 的 调 优 方法 是 解决 问题 的 根源 ， 即 从 SQL 语句 本 身 入 手 。 通 常 通过 
查找 哪些 SQL 语句 消耗 的 资源 最 多 来 获得 有 问题 的 SQL, 然后 决定 采取 一 定 的 SQL 调 优 
措施 来 减少 资源 消耗 。 

SQL 是 标准 的 数据 库 查 询 语言 。 从 某 种 意义 上 说 ，SQL 很 简单 ， 因 为 每 个 接触 过 数据 
库 的 人 都 会 使 用 ; 但 从 另 一 个 角度 来 看 ，SQL 也 很 复杂 ， 因 为 在 复杂 的 系统 中 ， 要 想 编 写 
出 简洁 、 高 效 的 SQL 语句 并 不 是 一 件 很 容易 的 事 。 

在 实际 的 生产 运行 中 ， 我 们 发 现 往往 引起 数据 库 性 能 瓶颈 的 是 那些 比较 耗 时 、 耗 资源 
的 SQL 语句 ，SQL 语句 性 能 调 优 是 数据 库 性 能 调整 的 重要 任务 之 一 。 本 章 我 们 主要 讲解 
SQL 语句 性 能 调 优 ， 主 要 内 容 包括 : 

e 通过 监控 定位 引起 性 能 资源 的 SQL 语句 
通过 解释 工具 分 析 SQL 语句 执行 计划 
理解 SQL 工作 方式 
SQL 调 优 案例 
提高 应 用 程序 性 能 
高 性 能 SQL 语句 注意 事项 
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9.1 通过 监控 找 出 最 消耗 资源 的 SQL 语句 


在 DB2 数据 库 中 ，SQL 语句 分 为 动态 SQL 语句 和 静态 SQL 语句 ， 不 管 是 哪 一 种 ， 我 
们 都 可 以 通过 查找 DB2 表 函 数 MON GET PKG CACHE STMT 来 找 出 最 耗 时 间 的 SQL 
语句 和 最 耗 CPU 的 SQL 语句 (具体 语法 和 指标 请 参照 DB2 V10.5 知识 中 心 )。 

最 耗 时 间 的 动态 SQL 语句 : 

db2 "SELECT STMT EXEC TIME/NUM EXEC WITH METRICS as AVG EXEC TIME， 


STMT TEXT FROM TABLE (MON GET PKG CACHE STMT('D’, NULL, NULL, -2))as T WHERE 
工 -NUM EXEC WITH METRICS <> 0 ORDER BY AVG EXEC TIME DESC" 


最 耗 CPU 的 动态 SQL 语句 : 


db2 "SELECT TOTAL CPU TIME/NUM EXEC WITH METRICS as AVG CPU TIME, 
STMT TEXT FROM TABLE (MON GET PRKG CACHE STMT ("DD’', NULL, NULL, -2)}) as T WHERE 
下 -NUM EXEC WITH METRICS <> 0 ORDER BY AVG CPU TIME DRESC 


那么 当 我 们 找 出 这 些 耗 时 的 SQL 后 ， 如 何 进行 调整 呢 ? 下 面 我 们 将 讲解 如 何 调 优 
SQL 。 


9.2 ”通过 解释 工具 分 析 SQL 语句 执行 计划 


一 条 SQL 语句 提交 给 DB2 数据 库 引 擎 进行 处 理 时 ，DB2 优化 器 会 对 其 加 以 分 析 ， 
Wi 计划 。 访问 计划 包括 将 用 于 执行 该 语句 的 策略 的 详细 信息 (例如 是 否 使 用 索引 ; 大 
有 排序 方法 ， 需 要 怎样 的 排序 方法 、 连 接 方式 、 nen 如 果 该 SQL 语句 是 嵌入 在 
应 用 程序 中 编写 的 ， 那 么 在 访问 计划 生成 于 预 编译 时 ， 另 外 还 会 生成 可 执行 形式 的 访问 计 
划 ， 作 为 称 为 “ 包 ” (package) 的 对 象 存储 在 系统 编目 表 (SYSCAT. STATEMENTS) 中 。 但 如 
果 语 句 是 通过 CLP 提交 的 ， 或 者 语句 是 应 用 程序 中 的 一 条 动态 SQL 语句 (也 就 是 说 ， 这 是 
一 条 在 应 用 程序 运行 时 构造 的 SQL 语句 )， 那 么 访问 计划 将 在 该 语句 发 出 时 生成 ， 而 生成 
的 可 执行 代码 则 临时 地 存储 在 内 存 中 (位 于 应 用 程序 包 绥 冲 区 中 (pckcache sz)), 而 不 是 系统 
系统 编目 表 。 这 样 ， 如 果 发 出 了 一 条 SQL 语句 ， 而 程序 包 缓 冲 区 中 已 有 其 可 执行 形式 的 访 
问 计 划 ， 那 么 已 有 访问 计划 将 被 重用 ， 不 会 再 次 调用 DB2 优化 器 ， 这 提高 了 性 能 。 

为 什么 说 这 非常 重要 ? 原因 在 于 ， 尺 管 可 以 使 用 数据 库 系 统 监 控 器 和 活动 监视 器 来 获 
取 关 于 某 些 SQL 操作 执行 的 情况 有 多 好 (或 多 糟 ) 的 信息 ， 但 不 能 用 这 些 监 控 器 来 分 析 单 独 
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SQL 语句 。 归 执行 此 关 分 析 ， 您 必须 能 够 捕获 并 但 看 存储 于 SQL 语句 的 访问 计划 中 的 信 
恩 。 而 为 了 捕获 并 得 看 访问 计划 信息 ， 我 们 必须 使 用 DB2 解释 工具 。 

使 用 解释 工具 , 您 可 以 捕获 并 得 看 为 特定 SQL 语句 选择 的 访问 计划 的 具体 信息 ,还 有 
可 用 于 帮助 确定 编号 不 展 的 语句 或 数据 库 中 能 点 的 性 能 信息 。 特 别 地 ， 解 释 数 所 将 帮助 我 
们 了 解 DB2 优化 强 如 何 为 满足 合 询 而 访问 表 和 和 索引。 解释 数据 还 可 用 于 评估 采取 的 任何 性 
能 调 优 行动 。 实 际 上 ， 只 要 您 瑞 改 了 数据 库 的 条 些 方 和 面 、SQL 语句 或 与 语句 交互 的 数据 库 
配置 参数 ， 都 应 收集 并 检 碍 解释 数据 ， 卉 清楚 您 的 更 改 对 性 能 产生 了 怎样 的 效 末 (如 朱 有 效 
果 的 话 )。 同 时 ， 理 解 一 条 SQL 语句 的 执行 计划 可 以 帮助 我 们 : 

e 理解 为 得 询 选择 的 执行 计划 。 簿 看 用 于 优化 SQL 语句 的 数据 库 统计 信息 。 
确定 是 奋 使 用 索引 来 访问 表 数 据 。 
允许 您 进行 “前 ”“ 后 ”对 比 ， 从 而 查看 性 能 调 优 的 效果 。 
获得 访问 计划 执行 的 各 操作 的 详细 信息 ， 包 括 各 操作 的 预计 成 本 。 
辅助 设计 应 用 程序 。 
人 确定 应 何 时 重新 绑 定 (rebind) 应 用 程序 。 
辅助 数据 库 设 计 。 


9.2.1 解释 表 


首先 创建 一 组 特殊 的 表 ( 解 释 表 )， 之 后 才能 捕获 解释 信息 。 和 9-1 列 出 了 所 有 解释 表 
以 及 各 表 用 于 存储 的 信息 。 


表 9-1 解释 表 
表 名 内 容 
EXPLAIN ARGUMENT 包含 各 独立 操作 符 的 特征 (如 果 存 在 的 话 ) 
包含 SQL 语句 的 源 的 基本 信息 ， 还 有 关于 环境 的 信息 
EXPLAIN INSTANCE (EXPLAIN INSTANCE 表 是 所 有 解释 信息 的 主要 控制 表 。 其 他 解释 表 
中 的 各 行 数 据 显 式 地 链接 到 该 表 中 的 各 行 ) 
EXPLAIN OBJECT 包含 SQL 语句 生成 访问 计划 所 需 的 数据 对 象 的 信息 
EXPLAIN OPERATOR 包含 SQL 编译 器 为 满足 SQL 语句 所 需 的 所 有 操作 符 
EXPLAIN PREDICATE 包含 确定 特定 操作 符 应 用 哪些 谓词 的 相关 信息 


包含 在 得 到 不 同 级 别 的 解释 信息 时 存在 的 SQL 语 名 文本。 用户 输入 的 

内 容 中 包含 原始 SQL 语句 

包含 关于 各 单独 操作 符 和 数据 对 象 之 间 存 在 的 输入 /输出 数据 流 的 信 
EXPLAIN_STREAM 息 (数据 对 和 象 本 身 显示 于 EXPLAIN_OBJECT 表 中 ,而 数据 流 中 涉及 的 

操作 符 可 在 EXPLAIN OPERATOR 表 中 找到 ) 


EXPLAIN SIATEMENTI 
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在 获得 一 条 SQL 语句 的 解释 数据 之 前 ,请 但 看 DB2 安装 目录 下 的 '$*DB2HOME/sqllib/misc/ 
explain.ddl(UNIX 或 Linux) 或 %DB2HOME\sqllib\misc\explain.ddl(WINDOWS)， 以 找到 解 
释 表 的 DDL。 然 后 必须 使 用 跟 调用 explain 工具 的 授权 ID 相同 的 模式 定义 一 组 解释 表 .。 
执行 : 


db2 —tvf EXPLAIN .DDL 
9.2.2 db2expln 


当 包 舍 租 入 陈 SQL 语句 的 源 代 但 文件 绑 定 到 数据 库 时 (无 论 和 是 在 预 编 详 过 程 中 还 是 在 
延迟 绑 定 过 程 中 )，DB2 优化 堪 将 分 析 遇 到 的 每 一 条 毅 态 SQL 语句 ， 并 生成 相应 的 访问 计 
划 ， 访 问 计划 随 后 以 程序 包 的 形式 存储 在 数据 库 中 (syscatpackages)。 给 定数 据 库 名 称 、 包 
名 称 、 包 创建 者 ID、 部 分 号 (如 果 指 定 了 部 分 号 为 0， 丈 处理 包 的 所 有 部 分 )，db2expln 工 
有 具 可 为 存储 在 数据 库 系统 目录 中 的 任何 包 解 释 并 说 明 其 访问 计划 。 由 于 db2expln 工具 直接 
处 理 包 而 非 全 面 解释 数据 或 解释 快照 数据 ， 因 而 通常 用 来 获取 那些 已 选 定 用 于 未 捕获 其 解 
释 数 据 的 包 的 访问 计划 的 相关 信息 。 但 由 于 db2expln 工具 仅 可 访问 已 存储 在 包 中 的 信息 ， 
因而 只 能 说 明 所 选 的 最 终 访问 计划 的 实现 ， 不 能 提供 特定 SQL 语句 优化 方式 的 信息 。 

如 果 使 用 额外 的 输入 参数 ， 那 么 db2expln 工具 还 可 用 于 解释 动态 SQL( 不 包含 参数 标记 
的 动态 SQL 语句 ) 语 句 。 

举 个 例子 ， 对 于 数据 库 SAMPLE 中 的 程序 包 DB2INST1.P0203450， 可 使 用 下 面 的 命 
令 查 看 : 

dD2expin dd SAMPLE dQ © db2instl Bp PO203450 让 

A 

-gg 是 指 给 出 存 取 计 划 的 图 形 输出 (用 字符 模拟 )。 

-s 0 是 指 分 析 所 有 的 SQL 命令 。 

下 面 是 相应 的 输出 : 

TBM DB2 Universal Database SQL and XQUERY Explain Tool Processing package 


DB2INST]1 .P0203420. 


支 砍 吉 克 翰 支 志 支 支 去 均码 克 支 支 支 支 支 支 支 忆 ACKAGE 去 支 支 支 友 砍 支 坎 志 支 云云 克 砍 友 志 志 支 支 友 友 
Package Name = DB2INSTL1 .P0203420 

一 一 一 一 一 一 一 一 Prep Date = 2002/12/17 

一 一 二 二 一 一人 Prep Time = 16:02:04 

0 Bind Timestamp = 2007- 12-17-16.02.04.373971 


一 一 一 一 一 一 一 一 Isolation Level 一 -一 一 一 一 一 一 一 = Cursor Stability 
SO Blocking------- 一 -一 一 一- 一 一 = Block Unambiguous Cursors 
0 QuUery Optimization Class = 5 
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一 一 一 一 一 一 一 一 Partition Parallel -= No 

一 一 一 一 一 一 一 一 Intra-Partition Parallel = No 

和 Function Patho——-—-—-—-—-——— = "SYSIBM" ， “SYSFUN™, "DB2INST]1" 
下 ET 

or tT 
和 Se TA 

sl 

SOL Statement: 

update STAFF set NAME = “test" 


where ID = 350 

Estimated Cost = 75 

Estimated Cardinality = 2 

Access Table Name = DB2INST1.STAFF ID = 2,3 
| #Columns = 2 

| Relation Scan 

| | Prefetch: Eligible 

| Lock Intents 

| | Table: Intent Exclusive 

| | Row : Update 

| Sargable Predlcate(s) 

| | #Predicates = 1 

Uedates Table Name — DB2INSTL STAFF 10— 2 3 
End of section 

优化 胡 Plan: 

A UPDATE 


-TBSCAN --Table: 
于 3. DB2INSTI 
En STAFF 
Table: 


SLAPEE 


可 以 用 下 面 的 命令 找 出 数据 库 中 存在 的 程序 包 : 


db< “Select pkgschema, pkgname irom syscat.packages 
where pkoqname = PPUZ03420 


上 面 例子 中 的 程序 包 DB2INST1.P0203450 是 存储 过 程 。 
但 看 动态 SQL 的 例子 : 


sdb2expln -d sample -9q “Select * from employee” -t 
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TBM DB2 Universal Database SQL and XQUERY Explain Tool 


支 砍 支 克 砍 支 去 砍 支 去 克 云云 克 吉 支 支 吉 支 去 TYNAMITC 友 支 去 支 支 坦克 坎 雄 支 砍 支 支 砍 支 支 坎 刘 支 砍 坎 去 克 坎 支 克 吉 支 克 吉 雄 


二 宇 守 二 生生 二 和 二 
Isolation Level = Cursor Stability 
Blocking = Block Unambiguous Cursors 
Query Optimization Class = 5 
Partition Parallel = No 
Intra-Partition Parallel = No 
SOQL Path — TSYSIBM™ “SYSFUN”,. “STSP 

"ORACLE™ 


Statement : 

select 六 

from employee 
Section Code Page = 1208 
Estimated Cost = 7.612985 
Estimated Cardinality = 42.000000 
Access Table Name = ORACLE.EMPLOYEE ID = 2,6 
#Columns = 14 
Avoid Locking Committed Data 
Relation Scan 
| Prefetch: Eligible 
Lock Intents 
| Table: Intent Share 
| Row : Nex Key Share 
sargable Predicate(s) 
| Return Data to Application 
| | Columns = 14 


Return Data Completion 


End of section 


9.2.3 db2exfmt 


与 db2expln 工具 不 同 , db2exfimt 工具 设计 用 于 和 直接 处 理 已 收集 并 存储 在 解释 表 中 的 全 
面 解释 数据 或 解释 快照 数据 。 给 定数 据 库 名 和 其 他 限定 信息 ，db2exfmt 工具 将 在 解释 表 中 
但 询 信 息 、 格 式 化 结果 ， 并 生成 一 份 基于 文本 的 报告 ， 此 报告 可 直接 显示 在 终 疹 上 或 写 入 
ASCII 文件 。 

所 有 explain 输出 都 是 从 下 往 上 读 的 ， 如 图 9-1 所 示 。 

这 里 将 所 有 细节 列 在 一 个 输出 文件 中 。 在 图 9-1 中 ， 每 个 操作 得 都 编 了 号， 当 您 往 下 
查看 时 ， 每 个 操作 符 都 将 被 详细 解释 。 例 如 ， 图 9-1 中 的 一 个 操作 符 可 以 作 如 下 解释 : 
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谈 Text Explain 操作 符 : 


5.7904 - # of rows returned (based on statistics calculation) 
HSJOIN — Eye a operator 
( 2) — operator #3 
a 汪 妆 而 — _ cumulative 七 Imerons 
了 Ts 


2 explain.out - Notepad es | : | 口 | x| 
Fis Edit Format Help 
original statement: 


select * 
IFrom employee e, department d 
where d.deptno = e.workdept 


Ioptimized statement: 


SELECT Q2.EMPNO AS "EMPNO", Q2.FIRSTNME AS "FIRSTNME", Q2.MID] 
MIDINIT", QZ2, LASTNAME AS "LASTNAME" Q2 ,WORKDEPT AS ; 

D2.PHONEND AS "PHONENO" es HIREDATE AS "HIREDATE", : 
Q2.EDLEVEL AS "EDLEVEL" ， O22. SEX AS "SEX", Q2. BIRTHDATE 
Q2 .SALARY AS "SALARY", Q2.BONUS AS "BONUS", Q2. COMM A: 
O11.DEPTNO AS "DEPTNO", QO1.DEPTNAME AS "DEPTNAME" ， DLL 
Ol. ADMRDEPT AS "ADMRDEPT", Q1.LOCATION AS "LOCATION" 

FROM FGMCARTH. DEPARTMENT AS Ql1, FGMCARTH.EMPLOYEE AS Q2 

WHERE (CQ1.DEFPFTNO = G2.WORKDEPT) 


点 记 亡 互 5 5 Plan: 


Total Cost: 75.1017 
QUerYy Degree: 


| TABLE: i TABLE: FGMCARTH 
EMP DEPARTMENT 


图 9-1 Text Explain 屏幕 


返回 的 行 数 、timeron(cost) 数 和 LO 都 是 优化 器 估计 的 ， 在 某 些 情况 下 可 能 与 实际 数 子 
不 付 。timeron 的 概念 我 们 前 面 已 经 讲 过 ， 它 是 DB2 的 成 本 度量 单元 ， 用 于 给 出 对 数据 库 
服务 器 在 执行 同一 得 询 的 两 种 计划 时 所 需 的 资源 或 成 本 的 粗略 估计 。 估 计时 计算 的 资源 包 
括 处 理 器 和 了 IO 的 加 权 成 本 。 

您 可 以 使 用 db2exfimt 来 解释 单独 一 条 语句 。 

为 一 条 语句 生成 Text Explain 输出 : 


explain all for 
SQL statement 
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db2exfmt -=—d 
dbname -9 七 IC 一 e 
explaintableschema -nNn $% -SS $$ -W -] -# 0 -oO 
outfile 


如 果 为 用 “;” 隔 开 的 儿 条 “explain all” 语 句 构 建文 本 文件 , 束 可 以 一 次 解释 多 条 语句 。 
为 多 条 语句 生成 Text Explain 输出 : 


Cty2 = 上 二 
file with statements 
db2exfmt -dd 
dbname -可 七 IC -e 
explaintableschema -nNn 要 -Ss 可 -WwW $$ -# 0 -0o 
outflile 


9.2.4 各 种 解释 工具 的 比较 


可 用 于 显示 全 面 解 释 数 据 和 解释 快照 的 不 同 工 具 有 看 很 大 的 差异 ， 无 论 是 在 复杂 性 方 
面 还 是 在 功能 方面 。 表 9-2 对 比 了 db2expln 和 db2exfmt， 并 强调 了 各 目的 特征 。 要 使 解释 
工具 发 挥 出 最 好 的 效果 ， 应 在 选择 工具 时 考 虚 实际 的 环境 和 需求 。 


表 9-2 可 用 解释 工具 的 比较 


所 需 特 征 db2exfmt db2expln 


用 户 界面 基于 文本 
快速 但 粗略 的 静态 SQL 分 析 是 
静态 SQL 支持 是 
动态 SQL 支持 是 
CLI 应 用 程序 支持 否 
详细 的 DB2 优化 器 信息 可 用 否 
适 于 分 析 多 条 SQL 语句 是 


9.2.5 ”如 何 从 解释 信息 中 获取 有 价值 的 建议 


当 分 析 explain 命令 的 输出 信息 时 ， 应 该 注意 以 下 问题 : 

e 对 相同 的 一 组 列 和 基本 表 使 用 的 ORDER BY、GROUP BY 或 DISTINCT 操作 符 将 
从 款 引 或 物化 得 询 表 (MQT) 中 受益 ， 因 为 有 了 款 引 ， 可 以 减少 排序 押 消 耗 的 时 间 。 
explain 可 帮助 确保 索引 被 正确 地 用 于 连接 谓词 、 本 地 谓词 以 及 GROUP BY 和 
ORDER BY 于 句 ， 以 尽量 避免 排序 。 


9.3 
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代价 较 融 的 操作 ， 例 如 大 型 排序 、 排 序 洲 出 以 及 对 表 的 大 量 使 用 ， 痢 可 以 受益 于 
更 多 的 排序 空间 (sortheap)、 更 好 的 索引 、 更 新 的 统计 信息 或 调 优 的 SQL。 

部 分 表 扫 描 也 可 以 从 索引 中 受益 。 

完全 索引 扫 朱 或 无 选择 性 的 索引 扫 拍 ， 其 中 不 使 用 start 和 stop 关键 字 ， 或 者 使 用 
这 两 个 关键 字 ， 但 是 有 看 很 宽 的 取 什 范围。 这 样 的 扫 摘 性 能 会 很 差 。 

表 的 连接 关 型 。 根 据 对 表 中 数据 的 了 解 来 确定 连接 类 型 是 否 正确 ， 以 及 用 于 连接 
的 内 部 表 和 外 部 表 的 表 是 否 正 确 。 

未 充分 地 利用 索引 。 查 询 是 否 按 期 望 使 用 了 索引 ? 此 问题 可 通过 查看 执行 计 
划 轻 松 应 对 。 如 果 确 实 存 在 过 引 ， 就 检查 基数 或 索引 键 的 顺序 。 确保 索引 的 集 
群 度 。 

表 基 数 和 'SELECT *' 的 使 用 。 有 时 ,根据 要 返回 的 列 数 ，DB2 优化 需 会 判定 扫描 整 
个 表 的 速度 更 快 。 

优化 级 别 的 设置 是 否 合适 。 


理解 SQL 语句 如 何 工作 


SQL 语句 在 执行 过 程 中 ， 谓 词 、 分 组 排序 、 扫 描 方 式 和 连接 关 型 等 都 会 对 SQL 语句 
的 执行 产生 重大 的 影响 ， 所 以 我 们 要 想 对 SQL 进行 调 优 ， 束 必须 先 了 解 这 儿 个 概念 。 


< 


理解 谓词 类 型 


SQL 的 另 一 个 灵活 特性 是 可 以 用 不 同 的 写法 来 完成 相同 的 功能 。 例 如 ，SQL 可 以 用 关 
联 或 能 套 查 询 来 达到 相同 的 目的 。 始 终 可 以 将 骨 套 查询 转换 成 等 价 的 连接 。 可 以 在 大 量 的 
函数 和 谓词 中 看 到 这 一 灵活 性 的 其 他 示例 。 上 其 有 等 价 功能 的 特性 的 示例 包括 : 


BETWEEN 与 一 />= 

IN 与 一 系列 和 OR 配合 的 谓词 

INNER JOIN 与 FROM 子 句 中 串 在 一 起 并 用 逗号 分 隔 的 表 
OUTER JOIN 与 带 有 UNION 的 简单 SELECT 和 相关 的 子 查 询 
CASE 表达 式 与 复杂 的 UNION ALL 语句 


not in 与 not exists 


SQL 展示 的 这 一 灵活 性 并 不 总 是 称心 如 意 ， 因 为 写法 不 同 但 功能 相同 的 SQL 谓词 可 
能 具有 不 同 的 性 能 。 
用 户 使 用 查询 语 名 访问 数据 库 ， 该 查询 语句 需要 用 谓词 限定 符 来 进行 数据 的 过 滤 。 这 
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些 限 定 符 通常 出 现在 查询 的 WHERE 子 句 中 。 这 种 限定 符 称 为 谓词 。 二 和 记分 组 为 4 
种 类 别 , 控 如 何在 求 值 过 程 中 使 用 请 词 以 及 何 时 使 用 来 确定 这 些 类 别 。 这 些 类 别 列 示 如 下 ， 
按 最 佳 性 能 到 最 差 性 能 的 顺序 排列 : 

e 沁 围 定 齐 俏 词 

e 有 系 引 控制 谓词 

e 数据 控制 谓词 

e 保留 谓词 (SARGable predicate) 

在 数据 库 内 部 ， 谓 词性 能 的 层次 如 图 9-2 所 未 。 


E = 地 人 > = EE 


二 入 ECECT.. 


&# # - 
图 9-2 ”谓词 性 能 的 层次 


看 了 上 面 的 图 9-2， 读 者 应 该 明白 我 们 在 写 SQL 语句 时 ， 应 该 尽量 用 最 下 面 的 谓词 类 
别 ， 因 为 越 往 上， 谓词 的 性 能 就 越 差 。 
表 9-3 概述 了 谓词 闫 别 。 后 面 会 更 详细 地 描述 每 个 关 别 。 


表 9-3 谓词 类 型 特征 的 摘要 
i 谓词 类 型 
| | 保留 
减少 索引 Jo 是 | 百 | 百 
减少 数据 页 TO 
城 少 内 部 传送 的 行 数 
减少 合格 行 的 数 上 
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范围 定 界 谓词 和 索引 控制 谓词 
范围 定 界 谓词 限制 索引 扫描 的 范围 。 它 们 提供 索引 搜索 的 开始 和 停止 键 值 。 索 引 控制 
谓词 不 能 限制 搜索 范围 ， 但 可 根据 该 索引 来 求 值 ， 因 为 在 该 谓词 中 涉及 的 列 是 索引 键 的 一 
部 分 。 例 如 ， 考 虑 下 列 索引 : 
INDEX Ixl: NAME ASC., 
DEPT NS 
MGR DESC, 
SALARY DESC, 
YEARS ASC 


也 考虑 包 合 下列 WHERE 子 句 的 得 询 : 


WHERE NAME = :hvil 
AND DEPT = :hv2 AND YEARS > :hvDy 


前 两 个 谓词 (NAME = :hvl 和 DEPT= :hv2) 是 范围 定 界 谓 词 ， 而 YEARS > :hv5 是 索引 
控制 谓词 。 

优化 器 在 对 这 些 谓词 求 值 时 读 取 索引 数据 而 不 是 恋 取 基本 表 。 这 些 索 引 控 制 谓词 减 小 
需要 从 表 中 读 取 的 行 集 ， 但 它们 不 影响 访问 的 索引 页 数 。 

XSCAN 数据 运算 符 扫 描 也 支持 XMLEXISTS 和 XMLIABLE 表达 式 中 出 现 的 
XML 数据 上 的 谓词 。 索 引 范 围 扫 摘 也 文 持 这 些 谓词 中 的 一 部 分 谓词 。 


数据 控制 谓词 

如 果 在 索引 页 里 取 不 到 值 ， 必 须 去 数据 页 取 值 的 谓词 称 为 数据 控制 请 词 。 这 些 请 词 通 
第 需要 访问 表 中 的 单独 行 。 

例如 ， 考 虑 在 PROJECT 表 上 定义 的 单个 索引 : 

INDEX IXO0: PROJNO ASC 

对 于 下 列 查询 ， 因 为 需要 过 滤 DEPTNO = 'D11' 的 数据 ， 但 表 PROJECT 上 只 有 字段 
PROJNO 的 索引 ， 所 以 需要 去 数据 页 里 查找 DEPTNO = 'D11' 的 数据 ， 将 DEPTNO = 'D11' 
谓词 视 为 数据 SARGable: 

SELECT PROJNO, PROJNAME, RESPEMP 

FROM PROJECT 


WHERE DEPTNO = "D11'" 
ORDER BY PROJNO 
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保留 谓词 

保留 谓词 比 访问 表 需 要 更 多 的 IO 成 本 。 它 们 可 具有 下 列 特征 : 

e 使 用 相关 子 查询 

e 使 用 量化 子 查 询 ， 这 些 子 查询 包含 ANY、ALL、SOME 或 IN 子 句 

e 试 取 LONGVARCHAR 或 LOB 数据 ， 该 数据 存储 在 与 表 分 开 的 文件 中 

这 种 谓词 由 “不 走 索 引 扫 描 ， 走 全 表 扫 描 ” 来 求 值 。 

有 时 ， 当 访问 数据 页 时 ， 必 须 重 新 应 用 仅 应 用 于 索引 的 谓词 。 例 如 ， 当 访问 数据 页 时 ， 
使 用 索引 OR 运算 或 索引 AND 运算 的 访问 方案 始终 要 将 这 些 谓 词 作 为 保留 谓词 重新 应 用 。 

谓词 总 结 : 下 面 的 图 9-3 给 读者 列 出 了 谓词 类 型 ， 哪 些 是 可 索引 的 谓词 ， 哪些 谓词 即 
使 存在 索引 ， 也 是 不 会 用 到 索引 的 。 


INDEXABLE 
Col=vaue | YY 
Col=nonolepr | YY 
COLISNL | YY 
COLoprae | YY 
CoLopnoncolepr | YY 
COLBETWEEN valuelANDvauez | YY 
COL BETWEEN nonco/expri AND noncolexpr? | YY | 
CollkEpattem | YY | 
CN | | 
COLUKEhostvanabe | YY | 
HoO=R | YY 
TlCOLopTCL | YY | 
Col=nonsubg) | YY 
COLop(nonsul | YY 
CoLopANY (nonsubq) | YY 
CoLlopAlllnonsubg) | YY 
CoINlnonsubg) | | 
Col=epression | YY 
(COLL...coOm IN(nonsubg) | YY | 
NON-INDEXABLE 
COL<c>vae | AN | 
COL<>noncleor | AN 
COLISNOTNLL | NN 
COLNOTBETWEEN valuel ANDvalie? | NN 
COL NOT BETWEEN noncolexprl AND noncolexpr? | _N 
CoNOTIN(SD) | AN 
COLNOTUKE'char | AN 
ColllkE%char | NN | 
COLUKE'car | NN | 
TL<>RO | NN 
TCOU=TICOR | NN | 
col<>(nnsubg) | NN 


图 9-3 ”谓词 类 型 


si 
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9.3.2 ”排序 和 分 组 
排序 分 为 两 个 阶段 : 排序 阶段 和 排序 结果 的 返回 阶段 。 


排序 阶段 

排序 可 以 是 洲 出 的 ， 也 可 以 是 非 淤 出 的 。 如 果 无 法 将 排序 的 数据 整个 放 入 排序 堆 中 
(sortheap， 排 序 堆 是 每 次 执行 排序 时 分 配 的 一 块 私有 内 存 )， 数 据 就 会 洲 出 到 数据 库 所 有 的 
临时 表 中 。 不 洲 出 的 排序 通常 执行 得 比 那 些 洲 出 的 好 。 


排序 结果 的 返回 阶段 

返回 可 以 是 管道 的 (piped)， 也 可 以 是 非 管道 的 mon-piped)。 如 果 排 序 信 息 可 以 直接 返 
回 ， 而 无 需 临时 表 来 存储 最 终 排序 的 数据 列表 ， 那 它 就 是 管道 排序 (piped sort)。 如 果 排 序 
信息 的 返回 需要 临时 表 , 那 它 就 是 非 管 道 排 序 (non-piped sort)。 管道 排序 通常 执行 得 比 非 管 
道 排 序 好 。 

当 优化 器 为 SQL 语句 选择 访问 方案 时 ,， 它 会 考虑 对 数据 排序 给 性 能 带 来 的 影响 。 当 没 
有 索引 满足 请 求 的 对 已 访 存 的 行 的 排序 时 ， 执 行 排序 。 当 优化 器 确定 排序 比索 引 扫 描 开 销 
较 少 时 ， 也 会 进行 排序 。 优 化 器 采用 下 列 其 中 一 种 方式 来 对 数据 进行 排序 : 

e。 当 执 行 查询 时 ， 通 过 管道 传送 排序 结果 。 

e 在 数据 库 管 理 器 内 对 排序 进行 内 部 处 理 。 

排序 时 间 取 决 于 多 种 因素 ， 包 括 要 排序 的 行 数 、 键 大 小 和 行 宽 。 如 果 要 排序 的 行 占用 
的 空间 超过 排序 堆 (sortheap) 中 可 用 的 空间 ， 那 么 执行 几 遍 排序 ， 每 一 遍 都 要 对 整个 行 集 的 
某 个 子 集 排序 。 每 遍 排序 的 结果 存储 在 缓冲 池 中 的 一 个 临时 表 内 。 如 果 缓 冲 池 里 没有 足够 
的 室 间 ， 可 以 将 此 临时 表 中 的 页 写 到 磁盘 。 当 所 有 排序 都 完成 时 ， 必 须 将 这 些 已 排序 的 子 
集合 并 为 单个 已 排序 的 行 集 。 


排序 中 的 分 组 操作 

当 排 序 产生 GROUP BY 操作 所 需 的 顺序 时 ， 优 化 右 在 排序 时 可 执行 GROUP BY 聚 
集 的 部 分 或 全 部 。 如 果 每 组 中 的 行 数 较 大 ， 这 种 做 法 就 有 利 。 如 果 在 排序 期 间 执行 一 些 分 
组 以 减少 或 消除 排序 溢出 到 磁盘 的 情况 ， 就 会 更 加 有 利 。 

排序 中 的 聚集 需要 以 下 3 个 聚集 阶段 以 确保 返回 正确 结果 。 

(D 聚集 的 第 1 个 阶段 “部 分 聚集 ”计算 聚集 值 ， 直 到 填 满 排序 堆 为 止 。 在 部 分 聚集 
中 ， 接 受 未 聚集 数据 并 产生 部 分 聚集 。 如 果 已 填 满 排序 堆 ， 其 余数 据 会 溢出 到 磁盘 ， 包 括 
在 当前 排序 堆 中 已 计算 的 所 有 部 分 聚集 。 在 复位 排序 堆 之 后 ， 开 始 新 的 聚集 。 

(2) 聚集 的 第 2 个 阶段 “中 间 聚 集 ” 提 取 所 有 溢出 的 排序 运行 结果 ， 并 根据 分 组 键 进 
一 步 聚集 。 由 于 分 组 键 列 是 分 布 键 列 的 子 集 ， 因 而 不 能 完成 聚集 。 中 间 聚 集 使 用 现 有 的 部 
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分 聚集 来 产生 新 的 部 分 聚集 。 此 阶段 并 不 总 是 会 发 生 。 它 用 于 分 区 内 和 分 区 间 并 行 性 。 在 
分 区 内 并 行 性 情况 下 ， 当 全 局 分 组 键 可 用 时 完成 分 组 。 在 分 区 间 并 行 性 情况 下 ， 如 下 分 组 
健 是 用 来 在 数据 库 分 区 间 分 组 的 分 布 健 的 子 集 ， 从 而 要 求 重 新 分 友 来 完成 聚集 时 ， 会 发 生 
这 种 情况 。 当 多 个 代理 程序 在 缩减 为 单个 代理 程序 以 完成 对 其 溢出 的 排序 结果 的 合并 时 ， 
在 分 区 内 并 行 性 中 将 存在 相似 的 情况 。 

(3) 聚集 的 最 后 阶段 “ 节 终 聚集 ”使 用 押 有 部 分 聚集 并 产生 最 终 聚 集 。 此 步骤 始终 通 
过 GROUP BY 运算 符 执 行 。 排 序 不 能 执行 完整 的 聚集 , 因为 它们 不 能 保证 排序 不 会 被 分 割 。 
完整 的 聚集 接受 未 聚集 的 数据 ， 然 后 产生 最 终 聚 集 。 如 果 分 发 不 能 禁止 它 的 使 用 ， 这 种 聚 
集 方法 通常 用 于 将 已 处 于 正确 顺序 的 数据 进行 分 组 。 

排序 和 分 组 是 比较 消耗 资源 的 , 所 以 在 SQL 语句 中 尽量 避免 无 谓 的 分 组 和 排序 。 关 于 
排序 的 监控 和 相关 配置 参数 的 配置 请 参见 本 书 “ 第 4 章 : DB2 配置 参数 调整 ”。 


9.3.3 连接 方法 


如 朱 奏 询 包 含 不 止 一 个 表 ， 那 么 融 应 该 使 用 连接 谓词 来 连接 那些 表 以 避 倪 篆 卡 尔 (Cartesian) 
连接 。 当 评估 得 询 执行 计划 时 ， 优 化 堪 计 算 并 比较 每 种 连接 方法 的 成 本 ， 然 后 选择 归 使 用 


的 最 佳 方法 。 最 常用 的 连接 方法 就 是 嵌 套 循 环 连接 、 合 并 连接 和 哈 希 连接 ， 


嵌 套 循环 连接 

在 谋 套 循环 连接 中 ， 将 扫描 第 一 个 (或 外 部 ) 表 以 查找 满足 查询 规则 的 行 。 对 于 在 外 部 
表 中 找到 的 每 一 行 ， 数 据 库 服务 器 将 在 第 二 个 (或 内 部 ) 表 中 搜索 相应 的 行 。 通 过 索引 扫描 
还 是 表 扫 描 来 访问 外 部 表 则 取决 于 该 表 。 如 果 有 过 滤 条 件 , 数据 库 服务 器 首先 会 应 用 它们 。 
如 果 内 部 表 没 有 索引 ， 那 么 数据 库 服务 器 就 会 将 在 表 上 构建 索引 的 成 本 与 连续 扫描 的 成 本 
进行 比较 ， 然 后 选择 成 本 最 低 的 那 一 种 方法 。 总 成 本 取决 于 连接 列 上 是 否 有 索引 。 如 果 连 
接 列 上 有 一 个 索引 ， 那 么 成 本 会 相当 低 ; 否则 ， 数据库 服务 器 就 必须 对 所 有 表 ( 外 部 和 内 部 
表 ) 执 行 表 扫描 。 


合并 连接 

当 连 接 表 的 连接 列 上 没有 可 用 索引 时 ， 通 常 使 用 该 连接 方法 。 连 接 开 始 之 前 ， 如 果 有 
过 滤 条 件 ， 那 么 数据 库 服务 器 首先 会 应 用 它们 ， 然 后 对 连接 列 上 每 个 表 中 的 行进 行 分 类 。 
一 旦 实现 对 行 的 分 类 ， 连 接 两 个 表 的 算法 就 十 分 容易 : 数据库 服务 器 仅仅 连续 地 读 取 两 个 
已 分 类 表 ， 并 合并 所 有 相 匹 配 的 行 。 因 为 该 方法 在 进行 表 连 接 之 前 ， 必 须 将 所 有 的 连接 表 
分 类 ， 所 以 成 本 通常 极 高 。 


哈 布 连 接 
当 一 个 或 多 个 连接 表 上 没有 索引 时 ， 或 者 当 数 据 库 服务 右 必 须 从 所 有 连接 表 中 读 取 大 
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量 行 时 ， 就 使 用 这 种 方法 。 在 该 方法 中 ， 需 要 扫描 其 中 的 一 个 表 ， 通 常 扫 描 较 小 的 那个 表 ， 
用 它 在 内 存 中 创建 哈 希 表 。 通 过 哈 希 函数 ， 将 具有 相同 哈 希 值 的 行 放 在 内 存 中 。 在 扫描 完 
第 一 个 表 并 将 它 放 在 哈 希 表 中 之 后 , 就 扫描 第 二 个 表 , 并 在 哈 希 表 中 查找 该 表 中 的 每 一 行 ， 
看 是 否 可 以 进行 连接 。 如 果 连 接 中 有 更 多 表 ， 那 么 数据 库 服务 器 将 对 每 个 连接 表 执 行 相同 
的 操作 。 

哈 希 连接 包含 两 个 动作 : 构建 哈 希 (或 者 是 我 们 所 称 的 构建 阶段 ) 以 及 探测 哈 希 表 ( 或 控 
测 阶 段 )。 在 构建 阶段 ， 数 据 库 服务 器 读 取 一 个 表 ， 并 且 在 应 用 所 有 现 有 过 滤 条 件 之 后 ， 在 
内 存 中 创建 哈 希 表 。 可 以 在 概念 上 将 哈 希 表 认 为 是 一 系列 的 内 存 bucket， 每 个 bucket 所 拥 
有 的 地 址 是 通过 应 用 哈 希 函数 从 键 值 导 出 的 。 数 据 库 服 务 器 不 会 在 特定 的 哈 希 bucket 中 对 
键 进行 分 类 。 在 探测 阶段 ， 数 据 库 服务 器 将 谈 取 连接 中 的 其 他 表 ， 如 果 存 在 连接 谓词 ， 束 
应 用 它们 。 在 满足 连接 谓词 限定 条 件 的 每 个 行 中 ， 数 据 库 服 务 器 将 对 键 应 用 哈 希 函数 ， 并 
探测 哈 希 表 以 查找 匹配 的 键 值 。 哈 希 连 接 通常 比分 类 合并 连接 快 , 因为 没有 涉及 分 类 操作 。 


9.3.4 ” 扫 拍 万 式 


扫 拉 方式 是 指 优化 顺从 数据 库 表 中 谈 取 (更 确切 地 说 是 检索 ) 数 据 的 方法 。 基 本 上 有 两 
种 方法 : 

e 最 个 时 的 方法 是 连续 恋 取 表 中 的 数据 ， 束 是 按照 我 们 通常 调用 它 的 方法 来 执行 表 
扫 搞 。 当 无 论 如 何 都 必须 谈 取 表 中 大 多 数 数 据 时 ， 或 者 当 表 没有 索引 时 ， 优 化 硕 
就 会 选择 执行 全 表 扫 描 。 

e 男 一 种 方法 束 是 使 用 索引 。 如 果 一 些 列 上 有 索引 ， 那 么 优化 右 也 许 能 使 用 索引 扫 
摘 (index scan)。 

表 9-4 对 这 两 种 方式 进行 了 总 结 。 


表 9-4 ”全 表 扫 描 与 索引 扫 接 


扫描 方式 描述 
ce in 使 用 可 选 的 局 动 /停止 条 件 扫描 表 索 引 ， 产 生 有 订 的 行 流 
TBSCAN 通过 百 接 从 数据 页 中 读 取 所 有 数据 来 检索 行 


优化 占 将 比较 每 种 方法 的 成 本 ,确定 使 用 最 好 的 一 种 。 它 将 评 信和 僵 询 执行 成 本 的 方 方 
面 面 ， 例 如 所 需 的 磁盘 IO 操作 数 日 、 将 被 检索 的 行 数 、 排 友 成 本 等 。 

通常 ， 在 返回 大 数据 量 的 情况 下 ， 我 们 应 尽量 选用 索引 扫描 ， 关 于 全 表 扫 描 和 索引 扫 
描 的 详细 信息 ， 请 参考 本 书 “ 第 7 章 : DB2 优化 磺 ”。 
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9.4 SQL 调 优 案例 


9.4.1 尽量 使 用 单条 语句 完成 逻辑 
让 我 们 从 一 个 简单 的 编码 技巧 开始 。 如 下 所 示 的 单个 INSERT 行 序列 : 


INSERT INTO tab comp VALUES (item]l, pricel, qty]l); 
INSERT INTO tab comp VALUES (item2, price2, qty2); 
INSERT TNTO tab comp VALUES (Eem DrICes qty3): 


可 以 改写 成 : 


INSERT INTO tab comp VALUES (iteml, pricel, gty1l), 
(item2, price2, qty2), 
(item3,. price3, gty3); 
执行 这 个 多 行 INSERT 语句 所 震 时 间 大 约 是 执行 原来 3 条 语句 的 三 分 之 一 。 抓 立地 看 ， 
这 一 改进 看 起 来 似乎 是 微乎其微 的 。 但 是 ， 如 条 这 一 代码 段 是 重复 执行 的 (例如 该 代 但 段位 
于 循环 体 或 触 上 友 吉 中 )， 那 么 改进 是 非 疝 显 关 的 。 
类 似 地 ， 如 下 所 示 的 SET 语句 赋值 序列 : 
eo A xprels 
生生 
SET C = expr3; 


可 以 写成 一 条 VALUES 语句 : 
本 全 全 六 站 下 下 和 其 用 下 二 全 式 站 主 辣 EN 下 全 向 丰 : 
如 条 任何 两 条 语句 之 间 都 没有 相关 性 ， 那 么 这 一 转换 保留 了 有 原始 序列 的 语义 。 为 了 说 


Sha montnilv av * 12 
SET B= (A/ 了) * correction factor:; 


将 上 面 两 条 语句 转换 成 : 
VALUES (monthly avg * lz2, (A 2 corraection factor) INTO A, B.; 


转换 后 的 语句 不 会 保留 原始 的 语义 因为 是 以 “并 行 ”方式 对 INTO 关键 字 之 前 的 表 
达 式 进行 求 值 的 。 这 意味 着 赋 给 B 的 值 并 不 以 赋 给 A 的 值 为 基础 ， 这 是 原始 语句 预期 的 
语义 。 这 样 可 以 提高 SQL 语句 性 能 。 
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9.4.2 合理 使 用 NOT IN 和 NOT EXISTS 


一 般 情 况 下 NOT EXISTS 具有 快 于 NOT IN 的 性 能 ， 但 是 这 并 不 绝对 。 根 据 具 体 的 数 
据 情况 、 存 在 的 索引 以 及 查询 的 结构 等 因素 ， 两 者 会 有 较 大 的 性 能 差异 ， 开 发 人 员 需 要 根 
据 实际 情况 选择 适当 的 方式 。 

例如 下 面 的 查询 : 

:instl accttacet id name, balance) 二 村 accE 41d 

表 结 构 ; inst1l.contact(contact id; acct 1d， point) 主键 contact jd 

表 结 构 : inst1l .contact detail(contact id，address，phone) 主键 ，contact id 

查询 : 

select balance Erom 1nstl.acct a 

where not exists (select 1 from instl.contact c 


Where a acct Id = tacct Td) 
代价 (cost): 139,109 timerons 


此 得 询 用 来 列 出 所 有 不 存在 联系 人 的 账户 余额 。 对 于 这 样 的 需求 ， 开 友人 员 会 很 目 然 
地 写 出 上 和 面 的 三 询 。 对 于 大 部 分 情况 ， 上 述 伍 询 具 有 最 优 的 性 能 。 让 我 们 再 来 看 看 使 用 
NOT IN 后 查询 的 总 代价 : 

查询 : 

select balance from i1nstl accEt a 


where a.acct 1d Tot In {select Cacct id from Instl.contackt ©) 
代价 (cost): 8,021,703,168 timerons 


可 以 看 到 NOT EXISTS 的 性 能 要 比 NOT IN 高 出 许多 。NOT IN 是 自 内 向 外 的 操作 ， 
即 先 得 到 子 查询 的 结果 ， 然 后 执行 最 外 层 的 查询 ， 而 NOT EXISTS 恰好 相反 ， 是 上 自 外 问 
内 的 操作 。 在 上 述 例子 中 ，instl.contact 表 中 有 100 万 条 记录 ， 使 得 查询 中 的 NOT IN 列表 


非常 大 ， 导 致使 用 NOT IN 的 查询 具有 非常 高 的 查询 代价 。 下 面 对 上 述 查 询 进 行 修改 ， 将 
instl.contact 表 中 的 记录 限制 到 100 条 ， 请 看 下 面 的 查询 : 
查询 : 


select balance from instl.acct a 

Where not exists (select 1 from instl.contact c 
where cc — cee nid 

and c.contact 1Q < 100) 

代价 : 29,500 timerons 


查询 : 
select balance From 0stl .acct a 
whore a acct Td mot Hm (ctoecor ec acoct id tromn nstl contact oe whore 


391 


392 


DB2 数据 库 性 能 调整 和 优化 (第 3 版 ) 


C-Contact 1id < 100) : 
代价 : 70,530 timerons 


从 上 面 可 以 看 出 : NOT EXISTS 的 合 询 代价 随 子 三 询 返回 的 结果 集 的 变化 没有 大 幅度 
下 降 ， 随 着 子 查询 的 结果 集 从 100 万 下 降 到 100 条 ，NOT EXISTS 的 查询 代价 从 139109 
下 降 到 29500， 只 下 降 4 倍 。 但 是 NOT IN 的 查询 代价 却 有 着 极 大 的 变化 ， 其 查询 代价 从 
8021703168 下 降 到 70530 下 降 了 113734 倍 。 可 见 子 查 询 的 结果 集 对 NOT IN 的 性 能 影响 
很 大 ， 但 是 这 个 简单 的 查询 不 能 说 明 NOT EXISTS 永远 好 于 NOT IN， 因 为 同样 存在 一 
些 因 素 对 NOT EXISTS 的 性 能 有 很 大 的 影响 。 我 们 再 看 下 面 的 例子 : 

查询 : 

select balance Erom 1nst1l1.acCCEt a 

Where not exlsts (select 1 from 1insti1.contact c 

hereq ect Tg ee 1g 

and. CC conkact. 1d in select Contact 9. from. Instl conktact. detarl 


where contact 1d<100)) 
代价 : 1,367,979 timerons 


查询 : 

select balance from instli.acct a 

where ‘a. ce Td Tot Jn select cc.acct 1d Trom nst1i. contact. 去 
where CC.contact 1d in (select contact 1d from inst]l.contact detalil 
Where contact 1d<100)) 

代价 ;， 449,568 timerons 


在 上 面 的 例子 中 ， 我 们 只 是 对 查询 增加 了 一 处 小 的 改动 ， 使 用 嵌 套 查询 限制 了 在 
instl.contact 中 扫 摘 的 范 围 。 但 是 在 这 两 个 新 的 得 询 中 ，NOT IN 的 性 能 却 又 好 于 NOT 
EXISTS。NOT EXISTS 的 代价 增加 了 46 倍 ， 而 NOT IN 的 代价 却 只 增加 了 6 倍 。 这 是 由 
于 NOTEXISTS 是 目 外 癌 内 操作 ， 藤 套 碍 询 的 复杂 度 对 其 存在 较 大 的 影响 。 因 此 在 实际 应 
用 中 , 要 考虑 于 得 询 的 结果 集 以 及 了 于 得 询 的 复杂 上 度 来 决定 使 用 NOT EXISTS 还 是 NOT IN。 
对 于 IN、EXISTS 和 JOIN 等 操作 ， 大 多 数 情 况 下 DB2 优化 器 都 能 形成 比较 一 致 的 最 终 答 
询 计划 。 

证 者 可 以 在 目 己 的 机 器 上 ， 创 建 两 张 表 来 模拟 这 个 实验 以 加 深 理 解 。 


9.4.3 利用 子 查询 进行 优化 


东 些 情况 下 可 以 将 但 询 中 的 东 一 部 分 馆 辑 捉 取 出 来 作为 子 得 询 出 现 ， 这 能 够 减少 扫描 
的 数据 量 ， 以 及 利用 索引 进行 数据 检索 。 请 看 如 下 但 询 : 


索引 : 
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nstl.1dx history date an nostl.history{(tstmp) 
Tstl. DX HISTORY ACCT Qn iNnatl listory (ACCT LD 


查询 : 

select a.NAME 

from instl.acct a yinstl.history h 

where dCT TD ACCD TD angd 
(h-TSTMP > current timestamp = 2 davs or 
a.BALANCE >100 ) > 


上 面 的 合 询 用 来 选择 余额 大 于 100 或 者 最 近 两 天 有 过 交易 的 账户 名 称 。 从 图 9-4(a) 的 


但 询 计 划 中 可 看 出 没有 任何 索引 被 使 用 。 


TESCANIS) 31, 833.6 
INST1. ACCT | | TESCANIS) 1,658, $6 


SORT (T) 1,658. 37 


RETURN (1) 42,820.93 


HSJOIN (3) 42, 820.93 


FETCH(12) 1,654.38 
| RIDSCH(14) 652.46 | |INST1. HISTORY 


SORT(1E) 62.46 


TESCAN(S5) 29,334.79 | | TESCAN(T) 1,765.63 | 


INST1. HISTORY 


(a) 


DX HISTORY TDATE 


TINSTL HESTORY | 
(b) 
图 9-4 但 询 计划 
使 用 子 查询 对 上 述 查 询 重新 改写 : 
查询 : 


with tmp as( 
Select ACCT IN from instl histeory h 


INST1. ACCT 


RETURN (1) 31, 996.27 


TBSCAN 3) 31,998.27 
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where Ph-TSTMP > current timestamp - 2 days) 

Select NAME from instl.acct a 

where a.ACcCT ID ln (select ACCT ID from tmp ) or 
a .BALANCE >100 


在 上 耐 的 查询 中 ， 我 们 使 用 子 查 询 预先 限定 了 要 扫描 instl.history 表 中 的 记录 数目 ， 
而 不 是 对 instl.history 表 进 行 全 表 扫 描 。 同 时 ， 在 预先 限定 数据 范围 的 时 候 ， 能 够 利用 
instl.idx_history_date 索引 。 请 看 其 但 询 计 划 ， 如 图 9-4(b) 所 示 。 可 以 看 到 合 询 代 价 有 大 幅 
度 下 降 。 其 实 ， 即 使 没有 instl.idx history date 索引 ， 修 改 后 的 查询 也 仍然 由 于 前 者 ， 因 为 
预先 限定 了 数据 的 扫 拉 范围， 减少 了 后 续 连 接 处 理 的 数据 量 ， 请 看 图 9-4(c)。 


9.4.4 ”调整 表 连 接 顺 序 使 JOIN 最 优 


一 般 情 况 下 ，DB2 会 根据 和 名表 的 JOIN 顺序 目 顶 同 下 顺序 处 理 ， 因 此 合理 排列 各 表 的 
连接 顺序 会 提高 租 询 性 能 。 
查询 : 


select a.name,c.point ,h.DELTA 
from instl.acct a 

left Join insti.contact C 

om qacct 1d cacet 1d 

Join instl.history h 

on h.acct id=a.acct id 

where a.balance >1007 


上 向 的 查询 用 来 选择 出 所 有 余额 大 于 100 元 的 账户 的 所 有 交易 记录 和 当前 积分 。 此 查 
询 会 按照 连接 的 顺序 先 将 instl.acct 表 和 instl.contact 表 进 行 LEFT JOIN， 然 后 使 用 结果 
集 去 JOIN instl.history 表 。 由 于 该 查询 使 用 了 LEFT JOIN, 因此 在 生成 中 间 结 果 集 的 时 候 
不 会 有 任何 记录 被 过 滤 择 ， 中 间 结 末 集 的 记录 数目 大 于 等 于 instl.acct 表 。 了 人 解 到 DB2 是 
如 何 解 释 和 执行 这 样 的 查询 后 ， 很 卓然 地 我 们 束 会 想到 将 JOIN 提前 。 

查询 : 

select a.name,c.point ,h.DELTA 

from instl.acct a 

Tarn nstl hstorv i 

emn acct 1d a acct 1d 

left Join 1nstl1 .Contact c 


on ort 1d et 40 
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where a.balance >100: 


图 9-5(a) 和 图 9-5(b) 分 别 为 上 述 两 个 查询 的 存 取 计划 。 在 上 面 的 查询 中 , 在 形成 中 间 结 
果 集 的 时 候 也 应 用 到 了 WHERE 语句 中 的 条 件 ， 而 不 是 在 所 有 JOIN 都 结束 以 后 才 被 应 
用 去 除 记录 的 。 


FIUI11 181,517.05 


TEEE 厢 (7 29,525.72 TESE 乔 站 ) 39,217. 的 | |WmST1.HISTORY 


FEIUEE 1L TD 675 ,09 


| EET 31,37d.25 


TEL 而 上) 59,217.05 


(a) (b) 
图 9-5 查询 计划 


我 们 的 原则 是 保持 中 间 结 末 集 最 小 ， 同 时 考 上 外 中 间 结 果 集 的 数据 上 总 量 以 减少 对 JOIN 
操作 内 存 的 需求 。 


9.4.5 ”数据 非 均匀 分 布 时 手工 指定 选择 性 


如 果 数 据 不 是 均匀 分 布 的 ， 那 么 指定 选择 性 就 十 分 有 用 。SELECTIVITY 指 任何 一 行 
满足 谓词 ( 即 为 真 ) 的 概 这 。 采 用 具有 闹 上 度 选 择 性 的 谓词 是 可 取 的 。 这 种 谓词 将 为 以 后 的 操 
作答 返回 更 少 的 行 ， 从 而 减少 为 满足 查询 所 需 的 CPU 和 LO。 

例如 ， 对 含有 1000000 行 的 表 执 行 选择 性 为 0.01(1%) 的 谓词 操作 ， 和 意味 看 大 约 只 有 
10000 行 满足 条 件 ， 而 另外 的 990000 行 都 不 满足 条 件 。 

如 果 不 是 仅仅 使 用 均匀 分 布 的 假设 ， 而 是 人 为 地 使 用 较 低 的 选择 性 (例如 0.000001) 来 
“保证 ”使 用 那 一 列 上 的 索引 ， 那 么 就 可 以 影 啊 优化 右 。 如 果 了 预料 到 表 要 增长 ， 并 且 和 希望 
确保 能 够 坚持 使 用 某 些 特定 列 上 的 索引 ， 那 么 这 一 点 就 十 分 有 用 。 如 果 想 阻止 DB2 在 某 一 
特定 列 上 使 用 有 索引， 那么 可 以 将 SELECTIVITY 设 为 1。 

有 了 这 种 技术 ， 使 用 优化 级 别 5 (例如 DFT QUERYOPT=5) 就 最 具有 可 预测 性 。 而 且 ， 
首先 必须 设置 注册 变量 DB2 SELECTIVITY=YES, 然后 在 使 用 SELECTIVITY 子 句 之 前 重 
新 司 动 实例 。 

可 以 为 下 列 谓 词 指 定 SELECTIVITY 子 句 : 
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e 基本 谓词 ， 其 中 至 少 有 一 个 表达 式 包 含 主机 变量 /参数 标记 (基本 谓词 包括 像 =、<>、 
< 和 <= 这 样 简单 的 比较 符 , 但 是 不 包括 像 IN、BETWEEN 和 JIS NULL 这 样 的 东西 )。 
e 其 中 的 MATCH 表达 式 、 谓 词 表 达 式 或 换 人 码 表达 式 中 包含 主机 变量 /参数 标记 的 
LIKE 谓词 。 
选择 性 的 值 必须 是 0 到 1 整个 范围 内 的 数值 常量 (numeric er 如 果 没 有 指定 
SELECTIVITY， 那 么 就 会 使 用 默认 值 。 如 果 SELECTIVITY 的 值 为 0.01， 那 么 意味 着 该 谓 
启 将 过 小 掉 除 表 中 所 有 行 的 1% 之 外 的 所 有 其 他 行 。 不 过 应 该 把 提供 SELECTIVITY 看 作 最 
后 一 招 。 
SmIECT Cl rm 3 FROM 下 | 
WHERE TI1l.x = T2.X AND 


T2.Yy = T3.Yy AND 

T1i.x >= 2 selectivity 0.000001 AND 
T2.Yy < 2 selectivity 0.5 AND 

T3 = ? selectivity 1 


9.4.6 ”使 用 UDF 代 蔡 查询 中 的 复杂 部 分 


由 于 UDF 是 预先 编译 的 ， 性 能 普 裔 优 于 一 般 的 查询 ，UDEF 使 用 的 存 取 计划 一 经 编译 
就 会 相对 稳定 。 我 在 开发 中 曾 多 次 发 现 , 使 用 UDF 代替 谷 询 或 视图 中 的 复杂 部 分 会 提高 几 
倍 甚至 儿 十 倍 的 性 能 , 主要 原因 是 迫使 DB2 使 用 指定 的 存 取 计划 来 充分 利用 索引 或 调整 其 
访问 过 程 (如 连接 顺序 、 过 滤 位 置 等 )。 使 用 UDF 进行 优化 的 基本 思路 是 : 将 复杂 查询 分 解 
为 多 个 部 分 执行 ， 针 对 每 个 部 分 优化 处 理 ， 将 各部 分 组 合 时 能 够 避免 存 取 计划 的 一 些 不 必 
要 变化 ， 优 化 整体 性 能 。 


查询 : 

select * from temp.customer where cust num in 

(select distinct sold to cust num from temp.order where add date > current 
timestamp — 2 months 

union 

select distinct cust num from temp.contact 

where add date > current timestamp — 2 months 


) 


上 面 这 个 查询 会 导 人 到 优化 器 生成 比较 复 洒 的 伍 询 计划 , 尤其 是 在 temp.customer 是 比较 
复 淋 的 视图 时 。 在 这 种 情况 下 ， 我 们 可 以 通过 创建 UDF， 将 其 分 步 执行 : 先 执 行 子 查询 获 
得 cust num 值 的 列表 ， 然 后 执行 最 外 层 的 查询 。 下 和 面 的 例子 是 通过 UDEF 对 上 述 查 询 的 改 
写 结果 : 
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CREATE FUNCTION temp.getCustNum(p date timestamp) 
RETURNS 

TABLE (cust num CHARACTER {10)) 

RETURN 

select distinct sold to cust num from temp.order 
where add date > p date 

union 

select distinct cust num from temp.contact 

Where add date > p date; 

select * from customer where cust num in 1 

select cust num from table (temp.getCcustNum(current timestamp - 2 months)) tbl 


) 


改写 前 后 的 查询 代价 分 别 是 445159.31 和 254436.98。 当 面 对 比 较 复杂 的 查询 时 ， 考 虑 
使 用 UDF 将 其 拆 分 为 多 步 执行 稼 常会 带 来 意 想 不 到 的 效果 。 在 实际 的 项 目 中 , 如 果 数 据 处 
理 和 查询 调用 包含 在 其 他 应 用 程序 中 (如 UNIX 脚本 、Java 程序 等 )， 那 么 同样 可 以 考虑 采 
用 分 步 数 据 处 理 的 方式 来 调用 数据 库 以 优化 应 用 性 能 。 


9.4.7 合并 多 条 SQL 语句 到 单个 SQL 表达 式 


跟 其 他 编程 语言 一 样 ，SQL 语 诗 提供 了 岗 类 条 件 构 竣 : 过 程 型 (IF 和 CASE 语句 ) 和 子 
数 型 (CASE 表达 式 )。 在 大 多 数 环 卉 中 ， 可 使 用 任何 一 种 构 千 来 表达 计算 ,到 上 抵 使 用 哪 一 种 
上 只 是 豆 好 问题 。 但 是 , 使 用 CASE 表达 式 编 与 的 逆 特 不 但 比 使 用 CASE 或 正 语句 编 与 的 过 
得 更 紧凑 ， 而 且 更 有 效 。 

请 考虑 下 和 面 的 SQL PL 代 公 片段: 


IF (Price <= MaxPrice) THEN 

INSERT INTO tab comp (Id, Val) VALUES (Oid, Price); 
ELsE, 

INSERT INTO tab comp (Id, Val) VALUES (Oid, MaxPrice); 
END PF; 


IF 子 句 中 的 条 件 仅 用 于 决定 将 什么 值 插入 tab comp.Val 列 中 。 为 了 避免 过 程 屋 和 数据 
流 层 之 间 的 上 下 文 切 换 ， 可 利用 CASE 表达 式 将 相同 的 还 辑 表示 成 一 个 INSERT 语句 : 


INSERT INTO tab comp (Id, Val) 
VALUES (O14d, 
CASE 
WHEN (Price <= MaxPrice} THEN Price 
ELSE MaxPrice 
END) ， 
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值得 注意 的 是 ，CASE 表达 式 可 在 任何 希望 有 标量 值 的 上 下 文中 使 用 。 特 别 地 ， 可 在 
赋值 全 写 的 右边 使 用 它们 。 例 如 : 


IF (Name IS NOT NULL) THEN 
SET ProdName = Name; 

ELSEIF (NamesStr IS NOT NULL) THEN 
SET ProdName = Namestr,; 

ELSE 
SET ProdName = DefaultName; 

END IF'; 


可 以 改 与 成 : 


SET ProdName = (CASE 
WHEN (Name IS NOT NULL) THEN Name 
WHEN (Namestr IS NOT NULL) THEN Namestr 
ELSE DefaultName 
END); 


实际 上 ， 这 个 特殊 的 示例 有 如 下 更 好 的 解决 方案 : 


SET ProdName = COALESCE (Name, Namestr, DefaultName)}); 


9.4.8 使 用 SQL 一 次 处 理 一 个 集合 语义 


诸如 循环 、 赋 值 和 游标 之 类 的 过 程 化 构造 允许 我 们 表达 那些 只 使 用 SQL DML 语句 是 
不 可 能 表达 的 计算 。 但 是 ， 当 我 们 拥有 一 些 可 以 随意 使 用 的 过 程 语 句 时 ， 即 使 我 们 手头 的 
计算 实际 上 仅 使 用 SQL DML 语句 束 可 表达 ， 但 转换 成 过 程 语句 还 是 有 风险 的 。 正 如 我 们 
以 前 提 到 的 ， 过 程 计 算 的 性 能 与 使 用 DML 语句 表达 的 同一 计算 的 性 能 相 比 会 慢 几 个 数量 
级 。 请 考虑 下 面 的 代码 片段 : 


DECLARE curl CURSOR FOR SELECT COL1L1，CoOT2 FROM tab comp; 
OPEN CUrl, 
FETCH Curl INTO Vi, VA, 
WHILE SQLCODE <> 100 DO 
IF {vl > 20)} THEN 
INSERT INTO tab sel VALUES (20, v2); 
ELSE 
INSERT INTO tab sel VALUES (vl, va); 
END IF; 
FETEH CUurl. INTOQ Wi, WA 
END WHILE.; 
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首先 ， 通 过 应 用 前 面 讨论 的 转换 可 以 改进 循环 体 : 


DECLARE curl CURSOR FOR SELECT Coll, col2 FROM tab comp; 
OPEN curl; 
FETCH Curl INTO v1, vA. 
WHILE SQLCODE <> 100 DO 
INSERT INTO tab sel VALUES (CASE 
WHEN Vl > 20 THEN 20 
ELSE wl 
END,. v2}, 
FETCOH DY] TINEQ vil v2 
END WHILE; 


但 是 通过 进一步 观察 ， 我 们 发 现 整个 代码 块 可 以 写成 带 有 SELECT 子 句 的 INSERT 语句 : 


INSERT INTO tab sel (SELECT (CASE 
WHEN coll > 20 THEN 20 
ELSE COLll 
END) ， 
COLZ 
FROM tab comp); 


在 原始 表述 中 ，SELECT 语句 中 每 行 的 过 程 层 和 数据 流 层 之 间 都 有 上 下 文 切换 。 在 最 
一 个 表述 中 ， 根 本 没有 上 下 文 切换 ， 并 且 优化 器 有 机 会 对 整个 计算 进行 全 局 优化 。 另 一 
方面 ,如果 每 条 INSERT 语句 针对 的 都 是 不 同 的 表 , 那么 这 种 简化 是 不 可 能 的 ， 如 下 所 示 : 


DECLARE curl CURSOR FOR SELECT Coll, col2 FROM tab comp; 
OPEN curl;.: 
FETCH CUurl INTO viI, VA» 
WHILE SQLCODE <> 100 DO 
IF {V1 > 20)} THEN 
INSERT INTO tab default VALUES (20, V2); 
ELSE 
INSERT INTO tab sel VALUES (v1, v2); 
END IF; 
FETCH CUE]L INTO V1, vas 
END WHILE; 


但 是 ， 这 里 也 可 以 利用 SQL 的 一 次 处 理 一 个 集合 (set-at-a-time) 特 性 : 
INSERT INTO tab sel (SELECT COll1l, col2 


FROM tab comp 
WHERE coll] <= 20)，; 
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INSERT INTO tab default (SELECT coOll, col2 
FROM tab comp 
WHERE coll > 20) 7 


9.4.9 在 无 副作用 的 情况 下 使 用 SQL 函数 


我 们 在 前 面 讲 过 SQL 过 程 和 SQL 函数 是 使 用 不 同 技术 实现 的 。SQL 过 程 中 的 查询 是 
单独 编译 的 ， 每 个 查询 都 成 为 包 中 的 一 个 节 。 编 译 是 在 过 程 创建 时 进行 的 ， 直 到 重新 创建 
过 程 或 者 百 到 重新 绑 定 与 其 相关 的 包 时 才 重 新 编译 这 些 得 询 。 

另 一 方面 ，SQL 函数 中 的 得 询 是 一 起 编译 的 ， 就 好 像 函 数 体 是 得 询 一 样 。 每 当 编 详 一 
条 使 用 SQL 函数 的 语句 时 ， 也 会 对 SQL 函数 进行 编 详 。 

与 SQL 过 程 中 所 发 生 的 情况 不 同 ，SQL 冰 数 中 的 过 程 语 句 与 数据 流 语 句 是 在 同一 层 
中 执行 的 。 因 此 ， 每 当 控 制 从 过 程 语句 流 同 数据 注 语 句 或 相反 时 ， 并 不 发 生 上 下 文 切换 。 

因为 存在 这 些 区 别 ， 所 以 当 给 定 的 过 程 代码 段 作 为 函数 实现 时 的 执行 速度 通常 比 作 为 
过 程 实现 时 要 快 。 但 是 ， 有 一 个 小 问题 。 函 数 只 能 包含 那些 不 会 改变 数据 库 状 态 的 语句 ( 例 
如 INSERT、UPDATE 或 DELETE 语句 是 不 允许 的 )， 并 且 只 人 允许 完整 SQL PL 语言 的 子 集 
出 现在 SQL 函数 中 (不 能 是 CALL 语句 、 游 标 和 条 件 处 理 )。 

尽管 有 这 些 限 制 ， 但 大 多 数 SQL 过 程 都 可 以 在 无 副作用 的 情况 下 转换 成 SQL 函数 。 
例如 下 面 的 过 程 : 

CREATE PROCEDURE GetPrice (IN Vendor CHAR(20) ， 


IN BIG INT, 
OUT BFICe DECIMAL(10, 3)) 


LANGUAGE SQL 
BEGLN 
IF Vendor = Vendor 1" THEN 
SET price = (SELECT ProdPrice 
FROM VlTable WHERE Id = P1d) ; 
ELSE IF Vendor = “Venaor 2" THEN 
SET price = (SELECT Price 
FROM V2Table WHERE Pid = GetPrice.P1d); 


END IF:; 
END 
等 同 于 下 面 的 函数 : 


CREATE FUNCTION GetPrice (Vendor CHAR(20), PId INT) 
RETURNS DECIMAL(10, 3) 

LANGUAGE SL 

BEGIN 
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DECLARE price DECIMAL (10 ， 3) 7 
IF Vendor = "Vendor 1" THEN 
SET price = (SELECT ProdPrice 
FROM VliTable WHERE Id = Pid); 
ELSE IF Vendor = Vendor 2" THEN 
SET price = (SELECT Price 
FROM V2Table WHERE Pid = GetPrice.P1id); 
END IF.; 
RETURN price; 
END 
请 注意 ， 尽 管 使 用 CALL 语句 来 调用 过 程 , 但 还 需要 使 用 VALUES 语句 从 命令 行 调用 
VALUES (GetPrice('IBM"', 324)) 


男 一 方向 ， 与 过 程 个 同 的 是 ， 您 可 以 在 允许 表达 式 的 任何 上 下 文中 调用 晃 数 : 

SELECT VName FROM Vendors WHERE GetPrice (Vname, Pid) < 100; 

SET price = GetPrice (Vname, Pid); 

因此 ， 正 如 本 节 标 题 所 展示 的 ， 当 您 只 是 从 数据 库 抽取 数据 而 不 执行 任何 更 改 时 ， 请 
考虑 使 用 SQL 函数 而 不 是 使 用 SQL 过 程 。 


9.4.10 ”小 结 


通过 上 面 的 示例 ,我 们 发 现 SQL 调 优 并 不 简单 , 它 包 合计 划 和 设计 者 很 好 的 铀 试 案 略 、 
细致 的 观察 和 深入 的 分 机 。 此 外 ， 各 种 平台 上 的 测试 结果 可 能 不 同 。 因 此 ， 您 震 要 在 测试 
环境 中 真实 反映 您 的 生产 环境 。 但 是 “一 分 耕耘 ， 一 分 收 获 ”， 当 看 到 性 能 获得 较 大 的 提 高 
时 ， 我 们 会 感到 十 分 有 成 束 感 。 我 布 望 大 家 好 好 理解 上 面 的 示例 和 分 析 ， 这 已 证 明 是 对 您 
有 所 帮助 的 ， 和 希望 本 下 能 充当 你 学 习 SQL 会 询 调 优 的 宝典 。 


9.5 ”提高 应 用 程序 性 能 


9.5.1 民 好 的 SQL 编码 规则 


1) SQL 语句 编号 应 简洁 、 易 谈 、 便 于 维护 。 

2) 在 每 条 SQL SELECT 语句 的 SELECT 列表 中 只 提供 确实 需要 检索 的 那些 列 。 男 一 
种 说 法 就 是 “不 要 使 用 SELECT *”。 简 写 SELECT * 表示 您 要 检索 正在 被 访问 的 表 中 的 
所 有 列 。 这 适用 于 使 用 “快捷 但 不 恰当 的 方式 获得 的 ”(quick and dirty) 但 询 ， 但 却 是 编写 
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应 用 程序 的 坏 习 惯 ， 因 为 : 
e DB2 表 在 将 来 可 能 需要 更 改 ， 新 增加 一 些 列 。SELECT * 也 会 检索 那些 新 的 列 ， 而 
如 果 没 有 进行 费时 的 应 用 更 改 ， 您 的 程序 也 许 无 法 处 理 新 增加 的 数据 。 
e DB2 将 为 被 请 求 返 回 的 每 一 列 消耗 附加 资源 。 如 果 程 序 不 需要 数据 ， 就 不 会 去 寻 
找 它 们 。 即 使 程序 需要 每 一 列 ， 节 好 根据 SQL 语句 中 的 名 称 来 显 式 地 寻找 每 一 列 ， 
以 便 增加 清晰 度 和 避免 以 前 犯 的 错误 。 
3) 不 要 寻找 您 已 经 知道 的 东西 。 这 上 听 起 来 似乎 显而易见 ， 但 大 多 数 程序 员 都 曾经 违反 
过 这 条 规则 。 举 一 个 典型 的 示例 ， 考 虑 以 下 SQL 语句 有 什么 错误 : 
SELECT EMPNO, LASTNAME, SALARY 


FROM EMP 
WHERE, EMPNO = “0UUUU1L0 


放弃 吗 ? 问题 是 EMPNO 已 经 包含 在 SELECT 列表 中 。 您 已 经 知道 EMPNO 将 等 于 值 
“000010”, 因为 那 束 是 WHERE 子 句 要 DB2 做 的 事 。 但 在 WHERE 子 句 中 列 出 了 EMPNO， 
DB2 还 会 尽职 地 检索 该 列 。 这 会 产生 附加 开销 ， 从 而 降低 性 能 。 


注意 : 
此 处 读者 不 要 钻 牛 角 尖 ， 因 为 实际 开发 中 可 能 我 们 确实 需要 返回 这 个 列 。 此 处 的 实验 
仅仅 为 了 说 明 SQL 编写 时 应 该 注意 的 原则 。 


4) 在 SQL 中 使 用 WHERE 子 句 过 滤 数 据 ， 而 不 是 在 程序 中 到 处 使 用 以 进行 过 滤 。 这 
也 是 开发 人 员 容 易 犯 的 错误 。 在 DB2 将 数据 返回 到 程序 之 前 ， 最 好 由 DB2 过 小 数据 。 这 
是 因为 DB2 使 用 附加 LO 和 CPU 资源 来 获取 每 一 行 数据 。 传 递 到 程序 的 行 越 少 ，SQL 的 
SELECT EMPNO, LASTNAME, SALARY 


FROM EMP 
WHERE SALARY > 320000.00; 


与 只 读 取 所 有 数据 而 不 使 用 WHERE 子 句 ， 然 后 在 程序 中 检查 SALARY 是 否 大 于 
50000.00 的 做 法 相 比 ， 该 SQL 更 好 。 

5) 确保 让 重复 的 语句 使 用 参数 标记 。 使 用 参数 标记 查询 ， 可 以 最 小 化 DB2 语句 的 
PREPARE 成 本 ， 只 需要 在 SQL 语句 中 使 用 一 次 参数 标记 ， 然 后 承 可 以 多 次 重用 。 参 数 化 
SQL 语句 包含 了 变量 ， 也 称 作 参数 (或 参数 标记 )。 上 典型 的 参数 标记 查询 使 用 这 些 参数 来 代 
奉 文 字 值 ， 因 此 WHERE 子 句 条 件 可 以 在 运行 时 更 改 。 通 常 程序 被 设计 成 最 终 用 户 可 以 在 
运行 查询 之 前 提供 参数 的 值 。 这 允许 使 用 查询 根据 提供 给 参数 的 不 同 值 返 回 不 同 的 结果 。 
使 用 参数 标记 ， 对 于 OLITP， 编 译 时 间 是 比较 可 观 的 ， 因 此 用 参数 标记 叔 换 文学 可 以 避 人 饮 
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重复 编译 。 当 使 用 参数 标记 时 ， 优 化 器 假设 值 是 均匀 分 布 的 ， 因 此 如 果 数 据 比较 偏 ， 那 么 
意味 看 所 选择 的 访问 计划 不 好 ， 这 种 情况 可 考虑 对 表 做 分 布 统计 信息 更 新 。 

参数 标记 查询 的 主要 性 能 好 处 是 优化 器 可 以 制定 在 重复 执行 语句 时 能 够 再 次 使 用 的 
存 取 路 径 。 与 每 次 WHERE 子 句 中 需要 新 值 就 发 出 一 条 全 新 的 SQL 语句 相 比 , 这 可 以 给 程 
序 增 加 很 大 的 性 能 收益 。 


9.5.2 提高 SQL 编程 性 能 


1) 要 确保 在 您 的 应 用 程序 中 ， 在 业务 逻辑 结束 后 尽快 发 出 COMMIT 语句 。 

COMMIT 语句 控制 事务 工作 单元 。 发 出 COMMIT 会 将 自 上 一 条 COMMIT 语句 之 后 
的 所 有 工作 “永远 ”记录 到 数据 库 中 。 在 发 出 COMMIT 之 前 ， 可 以 使 用 ROLLBACK 语句 
回 深 工 作 。 当 修改 数据 (使 用 INSERT、UPDATE 和 DELETE) 但 没有 发 出 COMMIT 时 , DB2 
将 在 数据 上 加 锁 并 保持 该 锁定 ,会 使 其 他 应 用 程序 在 访问 被 锁 住 的 数据 时 震 要 等 待 或 超时 。 
通过 在 事务 完成 时 发 出 COMMIT 语句 ， 并 且 确 保 数据 是 正确 的 ， 就 释放 了 锁 以 提高 并 发 
性 能 。 

2) 使 用 SELECT ... FOR UPDATE 保护 在 随后 的 UPDATE 语句 中 可 能 被 更 新 的 那些 
行 。 这 样 一 来 ， 选 中 的 所 有 行 上 便 获 得 了 更 新 (U) 锁 。 

3) 可 以 用 SELECT'FETCH FIRSTnROWS 来 限制 查询 结果 集 的 大 小 。 

读者 在 构建 应 用 程序 时 要 考虑 使 用 情况 。 例 如 ， 当 某 个 特定 查询 返回 几 千 行 给 最 终 用 
户 时 ， 要 慎重 处 理 。 对 于 在 程序 和 最 终 用 户 之 间 的 在 线 交 互 ， 很 少 会 用 到 几 百 行 以 上 的 数 
据 。 您 可 以 在 SQL 语句 上 使 用 FETCH FIRST n ROWS ONLY 子 句 来 限制 返回 到 查询 的 数 
据 量 。 例 如 ， 考 虑 以 下 得 询 : 

SELECT EMPNO, LASTNAME, SALARY 

EF ROM EMP 


WHERE SALARY > 10000.00 
FETCH FIRST 200 ROWS ONLY; 


该 查询 将 只 返回 200 行 。 即 便 有 超过 200 行 符合 条 件 也 没有 关系 ; 如 果 您 尝试 从 查询 
中 FETCH( 访 存 ) 超 过 200 行 , DB2 将 用 +100 SQLCODE 表明 数据 结束 。 当 您 想 要 限制 返回 
给 程序 的 数据 量 时 ， 这 种 方法 很 有 用 。 

4) 尽量 用 相同 数据 类 型 的 数据 进行 比较 ， 以 避免 发 生 数据 转换 。 

SQL 语言 对 于 数据 类 型 不 像 Java 和 C++ 那样 进行 严格 的 数据 类 型 检查 , 不 同 种 数据 间 
可 以 进行 菜 些 运算 ， 但 是 在 做 数据 操作 时 瑚 要 数据 库 进 行 隐 式 的 类 型 转换 。 在 大 数据 量 的 
全 询 中 ， 由 于 要 对 每 一 个 数据 项 做 同样 的 操作 ， 因 而 会 过 成 时 间 和 CPU 处 理 能 力 的 浪费 。 

实际 应 用 中 通常 发 生 的 隐 式 数据 类 型 转换 有 : 
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(1) 字符 型 到 数字 型 的 转换 ， 比 如 SELECT '1234' +3 FROM dual 等 。 

(2) 数字 型 到 字符 型 的 转换 ， 比 如 UPDATE DEPT SET EMPNO=5678 等 。 

上 述 转 换 都 是 隐 含 发生 的 ， 在 实际 使 用 中 要 避免 使 用 不 同类 型 的 数据 操作 。 

5) 正确 使 用 LIKE 通配符 。 

在 应 用 程序 中 为 了 使 用 方便 ， 对 字符 型 变量 进行 比较 时 经 常 使 用 LIKE 运算 符 进 行 字 
符 模 式 的 匹配 。 

需要 注意 的 是 ， 对 于 LIKE 运算 ， 如 果 通 配 符 % 出 现在 字符 串 的 尾部 或 中 间 ，LIKE 运 
算 符 将 可 以 使 用 索引 进行 字符 串 的 匹配 ,否则 如 条 通配符 % 出 现在 字符 串 的 开始 ，LIKE 束 
必须 使 用 全 表 扫 描 的 方式 去 匹配 字符 串 ， 这 将 产生 较 大 的 系统 负载 。 

一 般 情 况 下 ， 为 了 提高 系统 的 效率 ， 我 们 希望 用 户 能 够 在 通配符 的 左 站 提供 较 多 的 数 
据 信息 以 降低 得 询 的 数量 。 

6) 用 SELECT'OPTIMIZE FOR n ROWS 优化 返回 时 间 。 

DB2 支持 另 一 条 名 为 OPTIMIZE FOR n ROWS 的 子 句 , 该 子 句 不 限制 要 返回 给 游标 的 
行 数 ， 但 从 性 能 角度 看 可 能 是 有 帮助 的 。 使 用 OPTIMIZE FOR n ROWS 子 句 可 告诉 DB2 
如 何 处 理 SQL 语句 。 这 样 可 以 使 优化 器 快速 地 返回 行 ， 而 不 是 像 默 认 行 为 那样 ， 最 小 化 
整个 结果 集 的 人 代价。 此外， 如果 使 用 READ ONLY 子 句 ， 这 将 影响 在 每 个 块 中 返回 的 行 
数 ( 一 个 块 中 的 行 数 不 会 大 于 nn)。 这 不 会 限制 可 以 取 的 行 数 ,但 是 如 果 要 取 多 于 n 行 的 记录 ， 
歌 可 能 降低 性 能 。 为 了 使 该 子 句 对 数据 缓冲 区 有 一 定 的 影响 ,mx* row size 的 值 不 能 超出 通 
信 绥 冲 区 的 大 小 (由 DBM CFG RQRIOBLK 或 ASLHEAPSZ 定义 )。 


例如 : 
SELEBECT EMPNO, LASTNAME, SALARY 
FROM EMP 


WHERE SALARY > 10000.00 
OPTIMIZE FOR 20 ROWS; 


这 告诉 DB2 笠 试 尽快 访 存 前 20 行 。 如 果 您 的 应 用 程序 在 显示 从 数据 库 检 索 出 来 的 数 
据 行 时 每 次 显示 20 行 ， 那 么 这 将 非常 有 用 。 

7) 使 用 SELECT 'FORREAD ONLY( 或 FETCH ONLY) 表 明 结 果 表 是 只 读 的 。 

这 意味 着 不 能 在 随后 放置 的 UPDATE 或 DELETE 语句 中 引用 游标 。 这 可 以 帮助 提高 
FETCH 操作 的 性 能 , 因为 允许 DB2 执 行 块 操作 (对 于 给 定 的 FETCH 请 求 返 回 多 行 给 客户 )。 

对 于 只 读 游 标 ， 使 用 FOR READ ONLY 子 句 确保 游标 无 上 收 义 。 因 此 将 FOR READ 
ONLY 附加 到 每 条 SELECT 语句 后 面 可 以 使 洲 标 成 为 无 上 收 义 的 只 读 游 标 , 从 而 对 DB2 有 
所 帮助 。 例如 : 


SELECT EMPNO, LASTNAME, SALARY 
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EF ROM EMP 
WHERE, SALARY > 10000.00 
FOR READ ONLY; 


9.5.3 ”改进 游标 性 能 


在 调整 优化 现 有 存储 过 程 的 性 能 时 ， 为 消除 诉 标 循环 而 人 花费 的 任何 时 间 都 是 值得 的 。 

如 果 存 储 过 程 中 的 逻辑 确实 需要 游标 ， 那 么 要 使 性 能 最 优 ， 请 牢记 下 面 这 些 内 容 。 

首先 ， 确 保 不 使 用 高 于 您 所 需 的 隔离 级 别 。 隔 离 级 别 决定 了 存储 过 程 读 取 或 更 新 的 行 
应 用 的 锁定 的 数量 。 隔 离 级 别 越 高 ，DB2 执行 的 锁定 越 多 ， 因 此 为 同一 资源 而 竞争 的 应 用 
程序 之 间 的 并 发 就 越 少 。 例 如 ， 使 用 可 重复 读 (Repeatable Read，RR) 隔 离 级 别 的 过 程 将 形 
成 对 其 读 取 的 任何 行 的 共享 锁 ， 而 使 用 游标 稳定 性 (Cursor Stability，CS) 的 过 程 只 会 锁定 任 
何 可 更 新 游标 的 当前 行 。 可 以 使 用 db2 sqlroutine prepopts 注册 变量 来 指定 SQL 过 程 的 隔 
离 级 别 。 例 如 ， 要 将 SQL 过 程 的 隔离 级 别 设置 为 未 提交 读 (Uncommitted Read， 这 是 最 低 
的 隔离 级 别 ， 用 于 访问 只 读数 据 的 存储 过 程 )， 请 使 用 下 和 面 这 条 命令 : 


db256E Ob2 sqlroutine Prepopts "TSOLATION UB 


si EE. 
洼 忆 : 


要 使 该 设置 生效 ， 必 须 重新 启动 DB2 实例 ， 


DB2 中 默认 的 隔离 级 别 是 游标 稳定 性 。 但 是 ， 为 了 保持 应 用 程序 的 正确 性 ， 有 时 需要 
使 用 可 重复 读 。 还 需 记 住 一 件 重 要 的 事情 : 一 旦 创建 需要 可 重复 读 的 存储 过 程 ， 就 必须 将 
DB2 SQLROUTINE PREPOPTS 重新 设置 为 较 低 的 隔离 级 别 。 

有 闫 隔离 级 别 还 值得 一 提 的 是 ，DB2 允许 我 们 在 单独 的 得 询 中 履 兰 默认 的 隔离 级 别 ， 
如 下 所 示 : 


DECLARE curl CURSOR FOR SELECT coll FROM tab comp WITH UR; 


上 面 的 查询 将 以 隔离 级 别 UR 进行 执行 , 而 不 管 DB2 SQLROUTINE PREPOPTS 中 指 
定 的 隅 离 级 别 为 何 。 

下 竹 试 改进 洲 标 性 能 时 需要 牢记 的 一 个 相关 问题 是 诉 标 的 可 更 痢 能 力 。 如 果 诉 标 涉及 
的 行 可 以 使 用 INSERT 或 DELETE 语句 中 的 WHERE CURRENT OF 子 句 进行 更 新 或 删除 ， 
那么 游标 就 是 可 删除 的 。 当 游标 可 删除 时 ，DB2 必须 获取 行 上 的 互 斥 锁 ( 与 共享 锁 相 对 )， 
并 且 不 能 执行 行 分 块 (分 块 游标 ，blocking cursom。 行 上 的 互 斥 锁 甚 至 可 以 防止 其 他 应 用 程 
序 谈 取 该 行 (在 互 斥 锁 被 释放 之 前 ， 这 些 应 用 程序 必须 等 待 ， 除 非 它们 的 隅 离 级 别 是 UR)， 
而 行 分 块 通过 在 操作 中 检索 行 块 ， 从 而 减少 了 用 于 闹 标 的 数据 库 管理 器 开销 。 
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只 有 不 可 删除 的 游标 才 可 以 进行 行 分 块 ,这 就 是 为 什么 让 DB2 了 解 将 如 何 使 用 游标 很 
重要 的 原因 。 通 过 在 SELECT 语句 中 指定 FOR READ ONLY 子 句 ， 可 以 将 游标 显 式 地 声 
明 为 不 可 删除 ， 或 者 通过 在 SELECT 语句 中 使 用 FOR UPDATE 子 句 将 其 声明 为 可 删除 。 
根据 该 信息 ，DB2 将 确定 是 否 将 行 分 块 用 于 给 定 的 游标 。 

默认 情况 下 , 对 于 那些 使 用 FOR READ ONLY 子 句 定义 的 游标 , DB2 将 始终 使 用 行 分 
块 ， 除 非 指 定 了 BLOCKING NO 绑 定 选项 。 另 一 方面 ， 如 果 使 用 了 BLOCKING ALL 绑 定 
选项 ， 那 么 对 于 模糊 (二 义 ) 游 标 ( 既 不 是 定义 成 FOR READ ONLY， 也 不 是 定义 成 FOR 
UPDATE 的 游标 )，DB2 将 使 用 行 分 块 。 

简 而 言 之 : 如 果 可 能 ， 在 游标 定义 中 使 用 FOR READ ONLY 子 句 ; 如 果 您 的 存储 过 
程 包含 模糊 游标 ,那么 请 使 用 BLOCKING ALL 绑 定 选项 。 要 设置 BLOCKING 绑 定 选 项 的 
值 ， 我 们 还 可 以 使 用 db2 sqlroutine prepopts 注册 变量 。 例 如 ， 要 将 SQL 过 程 的 隔离 级 别 
设置 为 未 提交 读 ， 并 将 行 分 块 设置 为 BLOCKING ALL， 请 使 用 下 面 这 条 命令 : 

db2set dbB2 sqlroutine prepopts—="ITSOLATION UR BLOCKING ALL” 


对 于 返回 大 型 结 末 集 的 过 程 而 言 ， 分 块 (blocking) 特 别 重 要 。 
通过 使 用 db2 sqlroutine prepopts 注册 变量 ， 还 可 以 为 存储 过 程 指定 其 他 绑 定 选项 。 


9.5.4 ”根据 业务 逻辑 选择 最 低 粒 度 的 隔离 级 别 


为 了 拥有 更 好 的 粒度 、 更 好 的 性 能 和 并 发 性 ， 可 以 在 语句 级 指定 业务 旬 辑 允许 的 最 低 
隅 离 级 别 。DB2 文 持 UR、CS、RS 和 RR 隔离 级 别 。 例 如 ,SELECT * FROM STAFF WITH 
UR 将 使 用 Uncommitted Read( 最 小 锁 ) 执 行 SELECT 语句 。 关 于 锁 和 隔离 级 别 的 详细 描述 ， 
请 参见 本 书 “ 第 5 章 : 锁 和 并 发 ”。 


9.5.5 ”通过 REOPT 绑 定 选 项 来 提高 性 能 


如 条 用 于 输入 变量 (例如 参数 标记 、 箱 主要 量 、 全 局 变量 和 专用 寄存 吉 ) 的 值 超 出 了 默 
认 过 滤 因 子 估计 的 预期 范围 ， 那 么 在 执行 期 间 SQL 查询 的 执行 情况 可 能 很 差 。 由 于 不 知 
道 实际 数据 值 的 一 些 方案 的 默认 过 滤 因 子 ， 会 估计 以 下 情况 : 使 用 实际 数据 值 时 ， 在 运行 
时 实际 上 将 返回 多 少 行 。 

对 于 占用 资源 很 多 的 SQL 语句 ， 碍 看 实际 的 变量 值 (字符 ) 而 不 是 参数 标记 也 许 对 优化 
吉 较 为 有 益 。 实 现 此 目的 一 种 简单 方式 就 是 在 代码 中 使 用 字符 ， 而 不 是 使 用 参数 标记 。 但 
是 ， 这 将 导致 语句 缓存 发 生 过 多 的 插入 活动 ， 洪 在 地 影响 性 能 和 内 存 使 用 ， 因 为 仅 有 一 条 
字符 值 不 同 的 SQL 语句 就 会 被 当 作 不 同 的 语句 .对 于 包 中 的 静态 SQL( 比 如 SQL 存储 过 程 )， 
通过 REOPT ALWAYS 绑 定 或 预 编 译 选 项 , 可 以 在 使 用 参数 标记 的 同时 允许 通过 值 进行 优化 。 
对 于 DB2 V9 和 动态 SQL， 也 可 以 通过 全 局 或 语句 级 别 的 优化 配置 来 指定 REOPT ALWAYS。 
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REOPT 绑 定 选项 指定 是 否 让 DB2 通过 使 用 条 主要 量 、 参 数 标记 、 全 局 变量 和 专用 寄 
存 器 的 值 来 优化 访问 路 径 。REOPT 的 值 分 别 由 BIND、PREP 和 REBIND 命令 的 下 列 目 变 
量 指定 : 

e REOPT NONE: 将 不 使 用 宿主 变量 、 参 数 标 记 、 全 局 变量 或 专用 寄存 器 的 实际 值 
来 对 包含 这 些 变 量 的 给 定 SQL 语句 的 访问 路 径 进 行 优 化 ;而 是 使 用 这 些 变量 的 默 
认 估 计 值 。 对 此 方案 进行 了 高 速 缓存 ， 并 且 将 来 会 使 用 此 方案 。 这 是 默认 行为 。 

e REOPT ONCE: 在 第 一 次 执行 查询 时 ， 将 使 用 宿主 变量 、 参 数 标 记 、 全 局 变量 或 
专用 寄存 器 的 实际 值 来 优化 给 定 SQL 语句 的 访问 路 径 。 对 此 方案 进行 了 高 速 组 
存 ， 并 且 将 来 会 使 用 此 方案 。 

e REOPT ALWAYS: 将 始终 使 用 每 次 执行 时 已 知道 的 笨 主 变量 、 参 数 标 记 、 全 局 变 
量 或 专用 寄存 需 的 值 来 编译 和 重新 优化 给 定 SQL 语句 的 访问 路 径 。 


9.5.6 ”统计 信息 、 碎 片 整 理 和 重新 绑 定 


要 实时 保持 数据 库 的 统计 信息 为 最 新 的 ， 在 合适 的 时 间 调 度 RUNSTATS。 定 期 对 表 和 
索引 做 碎片 整理 。 

当 开 发 骨 入 SQL 程序 时 ， 单 独 的 SQL 查询 被 编译 成 程序 包 中 的 节 。 其 中 ，DB2 优化 
髓 根据 表 的 统计 信息 (例如 ， 表 大 小 或 某 列 中 数据 值 出 现 的 相对 频率 ) 以 及 编译 得 询 时 可 用 
的 索引 来 选择 查询 的 执行 方案 。 当 表 经 过 了 重大 更 改 时 ,让 DB2 再 次 收集 有 关 这 些 表 的 统 
计 信 息 可 能 是 个 好 主意 。 当 更 新 了 统计 信息 时 ， 或 者 当 创建 了 新 的 索引 时 ， 重 新 绑 定 那些 
与 使 用 表 的 SQL 过 程 相 关联 的 包 ， 以 使 DB2 创建 使 用 最 新 统计 信息 和 索引 的 方案 ， 这 可 
能 也 是 个 好 主意 。 

可 以 使 用 RUNSTATS 命令 更 新 表 的 统计 信息 。 要 重新 绑 定 与 SQL 过 程 关 联 的 包 ， 可 
以 使 用 REBIND ROUTINE PACKAGE 内 置 过 程 。 例 如 ， 可 以 使 用 下 面 这 条 命令 来 重新 绑 
定 过 程 MYSCHEMA.MYPROC 的 包 : 


CALL SYSPROC -REBIND ROUT INE PACKAGE ( 了 ， "MYSCHEMA .MYPROC", "ANY'") 

其 中 的 'P' 表 明 该 包 对 应 于 过 程 ， 而 'ANY' 表 明 SQL 路 径 中 的 任何 图 数 和 其 型 都 被 当 作 
函数 和 类 型 解析 。 

RUNSTATS、REORG 和 REBIND 的 关系 如 图 9-6 所 示 。 


图 9-6 RUNSTATS、REORG 和 REBIND 的 关系 
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9.5.7 ”避免 不 必要 的 排序 


排序 是 数据 库 中 资源 消耗 比较 大 的 一 种 操作 ， 我 们 希望 数据 库 中 排序 操作 的 数量 能 生 
被 尽量 减少 ， 同 时 每 个 排序 的 时 间 能 够 缩短 。 在 保证 业务 逻辑 正确 和 允许 的 情况 下 ， 应 该 : 

e 使 用 UNION ALL 代替 UNION。 

e 添加 索引 。 在 表 连 接 的 时 候 使 用 索引 可 以 避免 排序 的 发 生 ， 比 如 添加 合适 的 索引 ， 
可 以 使 连接 方式 由 合并 连接 (Merge Join) 转 变 为 使 用 索引 扫 插 的 散 合 循环 连接 
(Nested Loop Joimn)。 

e 在 DISTINCT、GROUP BY、ORDER BY 子 句 涉及 的 列 上 创建 索引 。 

e 使 用 较 大 的 sortheap 和 sheapthres 配置 参数 。 


9.5.8 ”在 C/S 环境 中 利用 SQL 存储 过 程 降低 网 络 开销 


在 C/S 环境 中 ， 通 过 最 小 化 到 客户 机 的 结果 集 通信 量 ，SQL 存储 过 程 能 够 降低 网 络 开 
销 ， 而 且 存储 过 程 也 能 够 改善 静态 ( 预 准备 的 )SQL 的 性 能 。 存 储 过 程 的 其 他 益处 还 包括 减 
少 客户 端 处 理 (通过 更 多 地 使 用 DB 服务 器 资源 ) 以 及 DB2 的 代码 管理 。 


9.5.9 ”在 高 并 发 环境 下 使 用 连接 池 


1) 利用 连接 池 ， 包 括 由 应 用 服务 需 管 理 的 连接 池 。 如 果 不 在 应 用 服务 器 环境 中 运行 ， 
就 使 用 由 应 用 程序 管理 的 连接 。 打 开 和 关闭 连接 的 过 程 开 销 较 大 ， 在 高 并 发 环境 下 ， 会 影 
啊 到 应 用 程序 或 数据 库 的 性 能 ， 而 使 用 连接 池 束 可 以 消除 大 部 分 这 样 的 开销 。 

2) 如 果 使 用 了 大 量 的 连接 ， 那 么 请 使 用 DB2 的 连接 集中 器 (connection concentrator) 功 
能 。 访 功能 只 允许 较 少 的 DB2“ 后 靖 ” 连 接 为 应 用 程序 连接 服务 ， 从 而 节省 了 内 存 。 

3) 有 效 地 使 用 JDBC 连接 池 。 前 先 , 确保 已 经 针对 列 数据 类 型 使 用 恰当 的 setxxx 方法 
将 数据 绑 定 到 参数 标记 。 这 会 避免 数据 其 型 转换 开销 过 高 和 可 能 的 SQL 数据 类 型 不 此 配 针 
误 。 其 次 ， 尽 可 能 避免 使 用 可 滚动 的 结 末 集 设 置 ， 因 为 服务 器 会 实现 临时 表 来 文 持 这 种 设 
置 。 使 用 这 种 设置 会 影响 到 性 能 ， 匹 其 是 在 使 用 大 的 结果 集 设 置 时 。 


9.5.10 使 用 Design Advisor(db2advis) 建 议 索 引 


一 旦 发 现 一 条 比较 消耗 资源 的 SQL 语句 , 将 该 SQL 语句 作为 输入 使 用 Design Advisor 
来 建议 索引 。 对 于 经 党 使 用 的 查询 以 及 大 型 或 复杂 的 查询 ， 这 一 点 尤其 重要 。 

此 外 ， 和 针对 由 测试 环境 压力 测试 程序 填充 的 动态 SQL 缓存 重新 运行 Design Advisor。 
这 允许 根据 实际 工作 负载 和 SQL 语句 的 执行 频率 建议 索引 。 俏 保 在 Design Advisor 执行 之 
前 运行 了 RUNSTATS 统计 信息 更 新 。 

另 一 个 方法 可 能 需要 较 多 的 操作 ， 但 是 允许 利用 潜在 的 (“虚拟 的 ”) 索 引 查 看 访问 计 
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划 。 可 通过 以 下 步骤 实现 : 

(1) 发 出 SQL 语句 SET CURRENT EXPLAIN MODE RECOMMEND INDEXES 

(2) 在 同一 会 话 中 执行 一 条 SQL 语句 ， 这 会 导致 用 建议 的 (“ 虚 拟 的 ”) 索 引 填 元 
ADVISE INDEX 表 。 

(3) 执行 SQL 语句 SET CURRENT EXPLAIN MODE EVALUATE INDEXES。 

(4) 执行 同一 条 SQL 语句 。 现 在 将 使 用 优化 套 根 据 实 际 和 虚拟 索引 选择 的 访问 计划 来 
填 元 解释 表 。 

(5) 最 后 ， 利 用 当前 和 建议 的 索引 ， 使 用 诸如 db2exfmt 和 db2expln 这 样 的 解释 工具 奉 
看 访问 计划 。 


9.5.11 提高 批量 删除 、 插 入 和 更 新 速度 


大 规模 的 DELETE/Purging 可 以 通过 使 用 下 面 的 语句 在 清除 表 的 全 部 数据 时 不 做 日 志 
记录 : 


ALTER TABLE ACTIVATE NOT LOGGED INITIALLY WITH EMPTY TABLE 


由 于 该 操作 没有 日 志 记 录 ， 如 果 哪 个 地 方 出 了 错 ， 束 不 得 不 将 表 删 除 。 

另 一 种 高 效 的 方法 是 使 用 LOAD 实用 程序 (市 上 Replace 选项 ) 和 一 个 宇文 件 ， 同 样 可 
以 在 不 记录 日 志 的 情况 下 将 表 的 数据 库 清 除 。 在 执行 清除 数据 的 LOAD 操作 之 前 ， 最 好 使 
用 EXPORT 工具 将 数据 备份 出 来 。 

为 了 提高 插入 和 更 新 数据 的 速度 ， 同 样 可 以 通过 不 记录 日 志 的 方式 。 当 然 ， 由 于 不 记 
录 日 志 会 造成 无 法 恢复 的 问题 ， 因 此 使 用 之 前 要 谨慎 考虑 。 

使 用 如 下 语句 可 以 实现 不 记录 日 志 : 

ALTER TABLE table-name ACTIVATE NOT LOGGED INITIALLY 

注意 : 

上 面 的 语句 必须 与 执行 数据 操作 的 SQL 语句 在 同一 事务 中 。 而 且 不 记录 日 志 设 置 的 影 
响 在 最 近 一 个 事务 提交 之 后 就 会 自动 失效 。 
9.5.12 提高 插入 性 能 

在 将 数据 插入 到 表 中 之 前 ， 插 入 搜索 算法 将 检查 可 用 空间 控制 记录 (FSCR)， 进 而 查找 
空间 足以 存储 新 数据 的 页 。 


但 是 ， 即 使 FSCR 指示 茶 页 的 可 用 空间 足够 ， 该 空间 也 可 能 因为 已 被 另 一 个 事务 中 未 
洛 实 的 删除 操作 你 留 而 不 可 用 。 
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db2maxfscrsearch 注册 变量 指定 将 记录 添加 到 表 时 要 搜索 的 FSCR 数 日 。 上 默认 情况 是 搜 
索 5$ 个 ESCR。 修 改 此 值 使 您 能 够 在 插入 速度 与 空间 复 用 之 间 进 行 平 衡 。 使 用 较 大 的 值 将 优 
化 空间 复 用 。 使 用 较 小 的 值 将 优化 插入 速度 。 将 值 设 置 为 - 1 表示 强制 数据 库 管理 器 搜索 所 
有 FSCR。 如 果 搜 索 FSCR 时 找 不 到 足够 的 空间 ， 那 么 数据 将 被 退 加 到 表 的 末尾 。 

ALTER TABLE 语句 的 APPEND ON 选项 指定 将 奶 加 表 数 据 ， 并 指定 不 保留 天 于 页 中 
可 用 空间 的 信息 。 这 样 的 表 不 能 带 有 集群 索引 。 对 于 只 增 大 不 减 小 的 表 ， 此 选项 能 够 提高 
性 能 。 

如 果 已 对 该 表 定 义 集 群 索引 ， 那 么 数据 库 管 理 吉 会 尝试 将 记录 插入 到 其 他 具有 关 似 过 
引 键 值 的 记录 所 在 的 页 。 如 果 该 页 上 没有 空间 ， 那么 将 考虑 周围 的 页 。 如 果 那 些 页 不 合适 ， 
那么 将 搜索 FSCR， 如 上 上 所 述 。 但 是 ， 在 这 种 情况 下 ， 将 使 用 “最 差 匹 配 ”方法 来 代替 “ 首 
先 匹 配 ” 方 法 。 节 差 匹 配方 法 往往 选择 包含 更 多 可 用 空间 的 页 。 此 方法 将 为 具有 类 似 键 什 
的 行 建 立新 的 集群 区 。 

如 果 已 对 表 定 义 集 群 索 引 ， 那 么 在 装 入 或 重组 该 表 之 前 ， 请 使 用 ALTER TABLE 语句 
的 PCTFREE 子 句 。 PCTFREE 子 句 指定 执行 装 入 或 重组 操作 后 应 该 在 数据 页 中 保留 的 可 用 
空间 所 占 的 百分比 。 这 将 提高 集群 索引 操作 能 在 适当 的 页 中 找到 可 用 空间 的 可 能 性 。 


9.5.13 ”高 效 的 SELECT 语句 


因为 SQL 是 一 种 灵活 的 高 级 语言 ， 所 以 您 可 以 编写 几 种 不 同 的 SELECT 语句 来 检索 

同一 数据 。 但 是 ， 对 于 不 同 的 语句 形式 和 不 同 的 优化 类 ， 人 性 能 可 能 相差 很 大 。 

请 考虑 下 列 有 关 创 建 高 效 SELECT 语句 的 准则 : 

e 仅 指 定 需要 的 列 。 使 用 星 与 ( 私 指 定 所 有 列 将 产生 不 必要 的 处 理 。 

e 使 用 谓词 将 结果 集 限制 为 仅 包 括 所 需 的 行 。 

e 如 果 需 要 的 行 数 远 远 小 于 可 能 返回 的 总 行 数 ， 那 么 请 指定 OPTIMIZE FOR 子 句 。 
此 子 句 将 影响 对 访问 方案 的 选择 以 及 在 通信 缓冲 区 中 分 块 的 行 数 。 

e 要 利用 行 分 块 方法 并 提高 性 能 ， 请 指定 FOR READ ONLY 或 FOR FETCH ONLY 
子 句 。 并 且 因 为 不 会 对 检索 到 的 行 挂 起 互 斥 锁定 ， 所 以 并 行 性 也 有 所 改进 。 此 外 ， 
还 可 能 会 发 生 其 他 的 查询 重 写 。 同 样 , 通过 指定 这 些 子 句 以 及 BLOCKING ALL 绑 
定 选 项 ， 可 以 提高 对 联合 数据 库 系 统 中 昵称 运行 的 查询 的 性 能 。 

e 对 于 将 与 定位 型 更 新 操作 配合 使 用 的 游标 而 吝 ， 指 定 FOR UPDATE OF 子 句 将 使 
数据 库 管理 器 能 够 选择 更 合适 的 初始 锁定 级 别 并 避免 发 生 潜在 的 死 锁 。 注 意 ， FOR 
UPDATE 游标 无 法 利用 行 分 块 方法 。 
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对 于 将 与 搜索 型 更 新 操作 配合 使 用 的 游标 而 吾 ， 指 定 FOR READ ONLY 和 USE 
AND KEEP UPDATE LOCKS 子 句 将 对 受 影 啊 的 行 强制 挂 起 U 锁定 ， 从 而 避免 死 
锁 并 仍 允 许 进 行 行 分 块 。 

尽 可 能 避免 进行 数字 数据 类 型 转换 。 在 比较 值 时 ， 请 尝试 使 用 具有 相同 数据 类 型 
的 项 。 如 果 需 要 执行 转换 ， 那 么 会 由 于 精度 受 限 而 导致 结果 不 准确 ， 并 且 会 由 于 
进行 运行 时 转换 而 导致 性 能 下 降 。 

在 有 可 能 的 时 候 ， 请 使 用 下 列 数据 类 型 : 

对 于 较 短 的 列 ， 尽 量 使 用 字符 而 不 是 可 变 字 符 。 

尽量 使 用 整数 ， 而 不 是 浮 点 数 、 小 数 或 DECFLOAT。 

尽量 使 用 DECFLOAT， 而 不 是 小 数 。 

尽量 使 用 日 期 时 间 ， 而 不 是 字符 。 

> 尽量 使 用 数字 ， 而 不 是 字符 。 

为 了 减 小 发 生 排 序 操作 的 可 能 性 , 请 省 略 DISTINCT 或 ORDER BY 之 类 的 子 句 (如 
果 此 类 操作 不 是 必需 的 )。 

要 检查 表 中 是 否 存 在 行 ， 请 选择 单一 行 。 请 打开 游标 并 访 存 一 行 ， 或 执行 单行 
SELECT INTO 操作 。 记 住 , 如 果 找 到 多 行 , 那么 需要 检查 是 否 发 生 SQLCODE -811 
错误 。 


除非 您 知 章 表 非 常 小 ， 人 否则 不 要 使 用 以 下 语句 来 检 碍 非 堆 值 : 


Vv YY VY Y 


select count (*})} from <table-name> 


对 于 大 型 表 ， 对 所 有 行 计数 将 影响 性 能 。 

如 条 更 新 活动 较 少 且 表 较 大 ， 那 么 请 对 谓词 中 频 素 使 用 的 列 定义 索引 。 

如 由 同一 列 出 现在 多 个 谓词 中 ， 那 么 请 考虑 使 用 IN 列表 。 对 于 配合 主 变 量 使 用 的 
大 型 IN 列表 ， 御 环 部 分 主 变 量 可 能 会 近 局 性 能 。 


下 列 建议 只 适用 于 访问 多 个 表 的 SELECT 语句 : 


使 用 连接 谓词 来 连接 表 。 连 接 谓 词 是 指 连 接 中 人 不同 表 的 两 个 列 之 间 的 比较 。 

对 连接 谓词 中 的 列 定 义 索 引 ， 以 便 更 高 效 地 处 理 连 接 。 对 于 包含 访问 多 个 表 的 
SELECT 语句 的 UPDATE 和 DELETE 语句 而 言 ， 索 引 也 有 助 于 提高 性 能 。 

有 可 能 时 ， 避 免 使 用 包含 连接 谓词 的 OR 子 句 或 表达 式 。 

在 分 区 数据 库 环 境 中 ， 建 议 根 据 连接 列 对 连接 的 表 进 行 分 区 。 
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9.6 ”高 性 能 SQL 语句 注意 事项 


9.6.1 避免 在 搜索 条 件 中 使 用 复杂 的 表达 式 


导 锡 在 搜索 条 件 中 使 用 复杂 的 表达 式 ， 这 些 表 达 云 将 导致 优化 喜 无 法 使 用 目录 统计 信 
县 来 估算 精 确 的 选择 性 。 

表达 去 还 可 能 限制 对 可 用 于 应 用 谓词 的 访问 方案 的 选择 。 在 优化 的 得 询 重 与 阶段 ， 优 
化 硕 可 以 重 写 许多 表达 式 以 使 估算 精确 的 选择 性 ， 但 无 法 处 理 所 有 的 可 能 性 。 


9.6.2 将 OPTIMIZE FORn ROWS 子 句 与 FETCH FIRSTn ROWS ONLY 子 
名 配合 使 用 


OPTIMIZE FOR n ROWS 子 句 通知 优化 器 ， 应 用 程序 计划 只 检索 于 行 ， 但 是 碍 询 将 返 
可 完整 的 结果 集 。FETCH FIRST n ROWS ONLY 子 句 指示 查询 应 该 只 返回 nn 行 。 

对 外 子 查询 指定 FETCH FIRST n ROWS ONLY 之 后 ，DB2 数据 服务 器 不 会 自动 采用 
OPTIMIZE FOR n ROWS。 请 尝试 同时 指定 OPTIMIZE FOR n ROWS 和 FETCH FIRST 7 
ROWS ONLY， 以 鼓励 使 用 直接 从 所 引用 的 表 返 回 行 而 不 首先 执行 缓存 操作 (例如 插入 到 临 
时 表 、 执 行 排 序 或 插入 到 艇 列 连接 敌 列 表 ) 的 查询 访 问 方案 。 

应 用 程序 如 果 指 定 了 OPTIMIZE FOR n ROWS 以 鼓励 使 用 避免 缓存 操作 的 查询 访问 方 
案 ， 但 却 检索 整个 结果 集 ， 那 么 性 能 可 能 会 欠 佳 。 这 是 因为 ， 返 回 前 n 行 的 速度 最 快 的 查 
询 访 问 方案 在 检索 整个 结果 集 时 可 能 不 是 最 好 的 查询 访问 方案 。 


9.6.3 ”人 训 侈 使 用 见 余 的 谓词 


避免 使 用 元 余 的 谓词 ， 当 它们 跨 不 同 的 表 出 现时 尤其 如 此 。 在 某 些 情况 下 ， 优 化 器 无 
法 检测 谓词 是 否 兄 余 。 这 可 能 导致 低估 基数 。 
例如 ， 在 SAP 商业 智能 (BD 应 用 程序 中 ， 将 带 有 事实 表 和 维 表 的 雪花 模式 用 作 查 询 优 
化 数据 结构 。 在 某 些 情况 下 ， 对 事实 表 和 维 表 定义 了 元 余 的 时 间 特 征 列 (用 于 月 份 的 SID_ 
0CALMONTH 或 用 于 年 份 的 SID OFISCPER)。 
SAP BI 联 机 分 析 处 理 (OLAP) 处 理 喜 将 对 维 表 和 事实 表 的 时 间 特 征 列 生成 见 余 的 谓词 。 
这 些 元 余 的 谓词 可 能 会 导致 得 询 运 行 时 间 延 长 。 
9.6.4 节 提 供 了 一 个 示例 ， 在 那个 示例 中 ，SAP BI 查询 的 WHERE 条 件 中 定义 了 两 个 
风 余 的 谓词 。 对 时 间 维 (DT) 和 事实 (F) 表 定义 了 完全 相同 的 请 词 : 
AND ! “DTIT…” .SID OCALMONTH™” = 11959602 
AND ™E™. STD DCALMONTHS = 199605 
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oR “DE SLID DCOAEMONTH” =— L99103 


AND FEF™. “SID OCALMONTH™ = 199702 ) 
AND NOT "DT”."SID OCALMONTH™” = 199803 
AND “FEF”. “SID OcaALMONTH® = 199803 ) 


DB2 优化 器 不 会 将 这 些 谓词 识别 为 等 同 ， 而 是 将 它们 视 为 相互 独立 。 这 将 导致 低估 基 
数 、 查 询 访 问 方案 欠 佳 以 及 查询 运行 时 间 延 长 。 

因此 , 特定 于 DB2 数据 库 平 台 的 软件 层 将 除去 元 余 的 谓词 。 上 述 谓词 将 转换 为 如 下 所 
示 的 谓词 ， 只 你 留 了 应 用 于 事实 表 列 SID 0CALMONTH 的 谓词: 
TSID OCALMONTH™ = 199605 


SID OCALMONTH™” = 199105 ) 
BE SID DALMONIEH = L99003 3 


AND ( er 
CR oer. 


AND NOT ( 
请 应 用 SAP 注意 事项 957070 和 1144883 中 的 指示 信息 以 除去 宛 余 的 谓词 。 


9.6.4 ”避免 使 用 多 个 带 有 DISTINCT 关键 字 的 聚集 操作 
青 避 免 使 用 在 同一 子 查询 中 执行 多 次 DISTINCT 聚集 操作 的 查询 ， 这 些 查 询 的 运行 成 


第 


了 
本 局 印 。 
请 考虑 以 下 示例 : 
SELECT SUMI{IDISTINCT REBATE)., 
FROM DAILY SALDLES 
GROUP BY PROD KEY 
要 确定 相 异 REBATE 值 和 相 异 DISCOUNT 值 的 集合 ， 可 能 需要 对 来 自 PROD _KEY 
表 的 输入 流 进 行 两 次 排序 。 此 得 询 的 得 询 访问 方案 可 能 类 似 于 图 9-7 所 示 。 


AVG (DISTINCT DISCOUNT) 


GAPBY 
t 
六 UNION 
| | 
GAPBY RPBY 
1 | 
SORT SOAT 
| | 
SCAN SCAN 
1 | 


DAILY SALES DAILY SALES 


图 9-7 食 询 访问 方案 
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优化 器 将 原始 奋 询 重 写 为 不 同 的 聚集 并 对 每 个 聚集 指定 DISTINCT 关键 字 , 然后 使 用 
UNION 关键 字 对 多 个 聚集 进行 组 合 。 在 内 部 重 写 的 语句 如 下 : 


SELECT Q8.MAXCO, (QQ8 .MAXC1L / Q8 .MAXC2) 
FROM 
(SELECT MAX (1 CU) AS MAXCO, MAX (QI.Cl1) AS MAXCl1, MAX (OQ.C2) AS MAXC2 
EF ROM 
(SELECT SUM'I(DISTINCT Q2.REBATE) AS CO, CAST (NULL AS INIEGER) AS C1, 
0 AS C2, Q2.PROD KEY 
EF ROM 
(SELECT Ql1 .PROD KEY, Ql .REBATE 
FROM DB2USER.DAILY SALES AS Ql1)} AS QZ 
GROUPE BY Q2.PROD KEY 
UNION ALL 
SELECT CAST (NULL AS INTEGER) AS CO, SUM(DISTINCT QD -DISCOUNT) AS Cl, 
COUNT (DISTINCT O05.DEISCOUNT) AS C2, 0 .PROD KEY 
EF ROM 
(SELECT Q4.PROD KEY, Q4.DISCOUNT 
FROM DB2USER.DAILY SALES AS 0Q4) AS QD 
GROUP BY OQ.PROD KEY) AS QI1 
GROUP BY QI.PROD KEY) AS QOS 


如 果 无 法 避免 使 用 多 个 DISTINCT 肾 集 ， 那 么 请 考虑 将 db2_extended optimization 注册 变 
量 与 ENHANCED MULTIPLE DISTINCT 选项 配合 使 用 ,此 选项 将 导 人 致 读 一 次 以 多 个 相 异 
聚集 为 目标 的 输入 流 ， 然 后 对 UNION 的 每 个 分 文 重 复 使 用 该 输入 流 。 此 选项 可 以 提高 这 
些 类 型 的 查询 的 性 能 。 其 中 ， 处 理 需 数 与 数据 库 分 区 数 的 比率 较 低 (例如 ， 比 率 小 于 或 等 于 
1)。 在 不 包含 对 称 多 处 理 占 (SMP) 的 分 区 数据 库 环 十 中 ， 应 该 使 用 此 设置 。 此 优化 扩展 功 
能 并 不 能 在 所 有 环境 中 提高 得 询 性 能 。 您 应 执行 测试 以 确定 各 个 查询 的 性 能 提高 情况 。 


9.6.5 ”避免 连接 列 之 间 效 据 类 型 不 匹配 


在 某 些 情况 下 ， 数 据 类 型 不 匹配 将 导致 无 法 使 用 散 列 连接 。 与 其 他 连接 方法 相 比 ， 散 
列 连接 对 连接 谓词 有 一 些 额 外 的 限制 。 尤 其 是 ， 和 例如 ， 
如 果 一 个 连接 列 是 FLOAT， 而 另 一 个 是 REAL， 那 么 不 支持 散 列 连接 。 另 外 ， 如 果 连 接 列 
的 数据 类 型 是 CHAR、GRAPHIC、DECIMAL 或 DECFLOAT， 那 么 长 度 必须 相同 。 


9.6.6 ”避免 对 表达 式 使 用 连接 谓词 


如 果 对 表达 式 使 用 连接 谓词 ， 那 么 连接 方法 只 能 是 藤 套 循环 连接 ， 并 且 估 算 的 基数 有 
可 能 不 准确 。 包 含 表 达 式 的 连接 的 一 些 示例 如 下 所 示 : 


414 


第 9 章 SQL 语句 调 优 


WHERE SALES.PRICE * SALES.DISCOUNT = TRANS.FINAL PRICE 
WHERE UPPER (CUST .LASTNAME) = TRANS .NAMP 


9.6.7 ”如 估 在 谓词 中 使 用 空 操 作 表 达 式 来 更 改 优化 器 估算 


格式 为 COALESCE(X, X)= 义 的 空 操 作 coalesce() 谓 词 将 导致 任何 使 用 它 的 查询 的 规划 
发 生 估 算 错 误 。 目 前 ， DB2 查询 编译 器 无 法 详细 分 析 该 谓词 并 确定 所 有 行 都 确实 满足 它 的 
要 求 。 

因此 ， 该 谓词 将 人 为 减少 来 日 某 个 查询 规划 部 分 的 估算 行 数 。 行 估算 值 减 小 通常 会 叶 
致 该 查询 规范 中 其 余部 分 的 行 和 成 本 估算 值 减 小 ， 有 时 还 会 导致 选择 另 一 个 方案 ， 这 是 因 
为 不 同 候选 方案 之 间 的 相对 估算 值 已 更 改 。 

为 何 这 种 空 操作 谓词 有 时 能 够 提高 查询 性 能 ? 添加 空 操 作 coalesce0 谓 词 将 引入 一 个 钳 
误 ， 该 错误 将 屏蔽 其 他 某 些 导致 性 能 无 法 达到 最 佳 水 平 的 内 容 。 

某 些 性 能 增强 工具 执行 的 是 强制 测试 : 工具 反复 地 将 该 谓词 引入 到 查询 中 的 不 同位 
置 ， 从 而 对 不 同 的 列 执 行 操作 ， 以 便 尝 试 找 到 能 够 通过 引入 错误 在 无 意 中 发 现 性 能 更 好 的 
方案 的 情况 。 对 于 在 查询 中 手动 编 僻 “ 空 操作 ”谓词 的 查询 开发 者 而 言 ， 情 况 亦 如 此 。 通 
常 ， 开 发 者 对 数据 有 一 定 程度 的 了 解 ， 这 有 助 于 确定 谓词 的 位 置 。 

使 用 此 方法 来 提高 查询 性 能 是 一 种 短期 的 解决 方案 ， 这 无 法 解决 根本 原因 ， 并 且 可 能 
会 造成 以 下 影响 : 

e 可 能 在 能 够 提高 性 能 的 领域 未 显现 。 

e 无 法 保证 此 变通 方法 能 够 永久 提高 性 能 ， 这 是 因为 ，DB2 查询 编译 器 最 终 可 能 能 

够 更 好 地 处 理 谓词 ， 其 他 随机 因素 也 可 能 会 对 其 产生 影响 。 

e 其 他 查询 也 可 能 会 受 同一 根本 原因 影响 ， 这 通常 会 导致 系统 性 能 有 所 下 降 。 

如 条 您 己 齐 循 最 佳 实践 建议 ， 但 相信 仍 未 实现 最 佳 性 能 ， 那 么 可 以 为 DB2 优化 堪 提 
供 明 确 的 优化 准则 ， 而 不 是 引入 空 操 作 谓 词 。 


9.6.8 确保 查询 符合 星 型 模式 连接 的 必需 条 件 


对 于 星 型 模式 ， 优 化 器 将 考虑 两 种 专用 的 连接 方法 一 一 星 型 连接 或 集 线 融 连接， 它们 
有 助 于 显著 提高 性 能 。 
但 是 ， 答 询 必 须 符 合 以 下 条 件 : 
e 对 于 每 个 查询 块 
> 必须 至 少 连 接 3 个 不 同 的 表 
> 所 有 连接 谓词 都 必须 是 等 式 谓词 
> 不 能 存在 子 但 询 
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> 在 各 个 表 之 间或 查询 块 外 部 不 能 存在 相关 性 或 依赖 性 
> 对 于 索引 与 (AND) 运 算 ， 不 能 存在 不 确定 函数 ， 这 是 因为 案 引 必须 应 用 事实 表 
谓词 以 便于 进行 半 连 接 
> 事实 表 
是 得 询 块 中 最 大 的 表 
至 少 包 含 10000 行 
被 认为 仅仅 是 一 个 表 
必须 至 少 连接 至 两 个 维 表 或 称 为 “雪花 ” 的 组 
> 维 表 
o 不 是 事实 表 
o 可 以 逐个 连接 到 事实 表 或 者 在 “雪花 ”中 进行 连接 
> 维 表 或 “雪花 ” 
o ”必须 对 事实 表 进行 过 滤 ( 过 滤 基 于 优化 器 的 估算 值 ) 
o 必须 存在 用 于 事实 表 并 且 使 用 事实 表 索 引 中 的 前 导 列 的 连接 谓词 。 必 须 和 村 
合 此 条 件 才 能 考虑 使 用 星 型 连接 或 集 线 占 连接 , 义 管 集 线 震 连接 只 需要 使 用 
单一 事实 表 索 引 
表示 左 外 连接 或 右 外 连接 的 查询 块 只 能 引用 两 个 表 ， 因 此 星 型 模式 连接 不 从 合 条 件 。 
不 需要 显 式 地 声明 引用 完整 性 即 可 使 优化 器 识别 星 型 模式 连接 。 


9.6.9 ”避免 使 用 非 等 式 连 接 谓 词 


因为 连接 方法 只 能 是 敬 套 循环 连接 ， 所 以 应 该 避 倪 使 用 比较 运算 符 不 是 等 式 连接 谓词 。 

万 外 ， 优 化 需 可 能 无 法 准确 计算 连接 谓词 的 选择 性 估算 值 。 但 证， 并 非 始终 能 够 避免 
使 用 非 等 式 连接 谓词 。 有 必要 使 用 非 等 式 连接 谓词 时 ， 确 你 存在 基于 任何 一 个 表 的 适当 索 
引 ， 这 是 因为 连接 谓词 将 应 用 于 藤 套 循环 连接 的 内 表 。 

非 等 式 连接 谓词 的 一 个 常见 示例 是 ， 必 须 对 星 型 模式 中 的 维 数据 进行 版 本 化 才能 准确 
地 反映 某 个 维 在 不 同时 间 点 的 状态 。 这 通常 称 为 缓慢 变化 的 维 。 其 中 一 种 缓慢 变化 的 维 涉 
及 包括 每 个 维 行 的 有 效 开始 日 期 和 结束 日 期 。 事 实 表 与 维 表 之 间 的 连接 除了 要 求 根据 维 主 
健 进 行 连接 以 外 ， 还 要 求 检 查 与 事实 相关 联 的 日 期 是 否 在 维 的 开始 日 期 与 结束 日 期 之 间 。 
这 通 节 称 为 第 6 类 绥 慢 变化 的 维 。 通 过 条 个 事实 事务 日 期 间 后 连接 到 事实 表 以 使 进一步 限 
定 维 版 本 的 范围 连接 成 本 很 局。 例如 : 

3 


FROM PRODUCT PP, SALES FE 
WHERE, 
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上 -上 EROD KEY = F.PROD KEY AND 
F .SALE, DATE BETWEEN P.START DATE AND 
P.END DATE 


在 这 种 情况 下 ， 确 保存 在 基于 (FEPROD KEY FSALE DATE) 的 索引 。 
请 考虑 创建 统计 视图 以 帮助 优化 器 为 此 方案 计算 更 好 的 选择 性 估算 值 。 例 妇 


CREATE STATISTICAL VIEW V PROD FACT AS 
SELECT P-* 
FROM PRODUCT 上 上， SALES FE 
WHERE 
P.PROD KEY = F.PROD KEY AND 
上 .SALE, DATE BETWEEN P.START DATE AND 
P.END DATE 
ALTER VIEW V PROD FACT ENABLE QUERY OPTIMITIZAATION 
RUNSTATS ON TABLE DB2USPER.V PROD FACT WITH DISTRIBUTION 


如 果 查 询 块 中 存在 任何 非 等 式 连 接 谓词 ， 那 么 不 考虑 专用 的 星 型 模式 连接 ， 例 如 使 用 
索引 与 (AND) 运 算 的 星 型 连接 和 集线器 连接 。 


9.6.10 ”避免 使 用 不 必要 的 外 连接 


某 些 查询 的 语义 需要 外 连接 ( 左 连接 、 右 连接 或 全 连接 )。 但 是 ， 如 果 碍 询 语义 不 需要 
外 连接 ， 并 且 该 查询 正 被 用 于 处 理 不 一 致 的 数据 ， 那 么 它 最 适合 于 处 理 数 据 不 一 致 问题 的 
根本 原因 

例如 ， 在 具有 星 型 模式 的 数据 集 市 中 ， 事 实 表 可 能 包含 事务 的 行 ， 但 由 于 数据 一 致 性 
问题 ， 某 些 维 没 有 [匹配 的 父 维 。 发 生 此 问题 的 原因 可 能 是 ， 抽 取 、 变 换 和 装 入 (ETL) 过 程 由 
于 某 种 原因 而 未 能 对 某 些 业务 键 进行 协调 。 在 此 方案 中 ， 事 实 表 行 以 左 外 连接 方式 与 维 连 
接 ， 确 你 它们 即使 没有 父 代 也 会 被 返回 。 例 如 : 


Ch ee 
FROM DAILY SALES 上 
LEFT OUTER JOIN CUSTOMER & ON F.CUST KEY = C.CUST KEY 
LEET QUTER JOIN SITIORE 5S ON FEF.STORE KEY 三 S-STORE EEY 
WHERE 
CCUST NAME = “SMITH: 


左 外 连接 也 会 导致 无 法 进行 多 项 优化 ， 其 中 包括 使 用 专用 的 星 型 模式 连接 访问 方法 。 
但 是 在 茶 些 情况 下 ， 答 询 优化 堪 可 以 目 动 地 将 左 外 连接 重 写 成 内 连接 。 在 本 例 中 ， 由 于 调 
词 C.CUST NAME ='SMITH' 将 除去 任何 在 此 列 中 包含 空 值 的 行 ， 从 而 使 左 外 连接 在 语义 
上 非 必 需 , 所 以 CUSTOMER 与 DAILY SALES 之 间 的 左 外 连接 可 以 转换 为 内 连接 。 因 此 ， 
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由 于 存在 外 连接 而 无 法 进行 条 些 优化 可 能 不 会 对 所 有 和 奏 询 产生 负面 影响 。 但 是 ， 了 解 这 些 
限制 并 避免 使 用 外 连接 (除非 绝对 有 需要 使 用 外 连接 ) 至 关 重 要 。 


9.6.11 使 用 参数 标记 来 缩短 动态 查询 的 编译 时 间 


DB2 数据 服务 占 可 以 将 访问 太 和 语句 文本 存储 在 动态 语句 忆 速 缓存 中 ， 从 而 避免 章 狐 
编 详 先前 已 运行 的 动态 SQL 语句 。 

对 此 语句 及 出 的 后 续 准 备 请 求 将 尝试 在 动态 语句 局 速 级 存 中 全 找 访问 市 ， 从 而 避免 进 
行 编译 。 但 是 ， 仅 在 谓词 中 使 用 的 字面 值 方面 有 所 不 同 的 语句 不 匹配 。 例 如 ， 下 面 这 两 条 
语句 在 动态 语句 高 速 缓存 中 被 认为 不 相同 : 


SELECT AGE FROM EMPLOYEE WHERE EMP ID = 26190 
SELECT AGE FROM EMPLOYEE WHERE EMP ID = 1/243 


即使 频 索 运行 相对 简单 的 SQL 语句 ， 也 会 由 于 语句 编 详 工 作 而 导致 系统 CPU 使 用 率 
过 高 。 如 采 系 统 过 到 此 类 性 能 问题 ， 那 么 请 考虑 更 改 应 用 程序 ， 以 便 使 用 参数 标记 将 谓词 
值 传递 给 DB2 编 详 郝 ， 而 不 要 显 式 地 将 它们 包括 在 SQL 语句 中 。 但 是 ， 对 于 在 谓词 中 使 
用 了 参数 标记 的 复杂 但 询 而 言 ， 此 访问 方案 可 能 并 非 最 佳 。 


9.6.12 使 用 约束 来 提高 查询 优化 程度 


请 考虑 定义 唯一 约束 、 检 查 约 束 和 引用 完整 性 约束 。 这 些 约束 将 提供 语义 信息 ， 这 些 
信息 使 DB2 优化 器 能 够 重 写 查 询 以 消除 连接 、 通 过 连接 下 推 聚 集 、 通 过 连接 下 推 FETCH 
FIRSTn ROWS、 除 去 不 必要 的 DISTINCT 操作 以 及 执行 许多 其 他 优化 。 

当 应 用 程序 本 身 能 够 确保 关系 时 ， 还 可 以 使 用 参考 约束 来 代替 检查 约束 和 引用 完整 性 
约束 。 在 这 种 情况 下 ， 可 以 进行 相同 的 优化 。 在 插入 、 更 新 或 删除 行 时 ， 数 据 库 管理 器 强 
制 实施 的 约束 可 能 会 引起 大 量 系 统 开销 ， 更 新 大 量具 有 引用 完整 性 约束 的 行 时 尤其 如 此 。 
如 果 应 用 程序 在 更 新 行 之 前 已 验证 信息 ， 那 么 使 用 参考 约束 可 能 比 使 用 常规 约束 效率 高 。 

例如 , 假定 有 两 个 表 DAILY SALES 和 CUSTOMER。CUSTOMER 表 中 的 每 一 行 都 有 
唯一 的 客户 键 (CUST KEY)。DAILY SALES 包含 CUST KEY 列 ， 并 且 每 一 行 都 引用 
CUSTOMER 表 中 的 客户 键 。 您 可 以 创建 引用 完整 性 约束 以 表示 CUSTOMER 与 
DAILY SALES 之 间 的 这 种 1:N 关系 。 如 果 应 用 程序 强制 实施 此 关系 ， 那 么 可 以 将 该 约束 
定义 为 参考 约束 。 于 是 ， 以 下 查询 可 以 避免 在 CUSTOMER 与 DAILY SALES 之 间 执 行 连 
接 ， 这 是 因为 不 会 从 CUSTOMER 中 检索 任何 列 ， 并 且 DAILY _ SALES 中 的 每 一 行 都 将 在 
CUSTOMER 中 找到 匹配 项 。 查 询 优化 器 将 自动 除去 连接 。 

SELECT AMT SOQOLD, SALE PRICE, PROD DEsSC 

FROM DAILY SALES, PRODUCT, CUSTOMER 
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WHERE 
DATLLY SALES.PROD KEY = PRODUCT. PRODKEY AND 
DATLY SALES.CUST KEY = CUSTOMER.CUST KEY 


应 用 程序 必须 强制 实施 参考 约束 ， 否 则 查询 可 能 会 返回 不 正确 的 结果 。 在 此 例 中 ， 如 
果 DAILY_SALES 中 的 任何 行 在 CUSTOMER 表 中 没有 相应 的 客户 键 ， 那 么 此 查询 将 不 正 
确 地 返回 那些 行 。 


9.7 ”本 章 小 结 


本 章 我 们 讨论 了 SQL 语句 调 优 的 相关 内 容 ， 包 括 SQL 语句 的 工作 机 制 、 调 优 工具 以 
及 调 优 时 的 注意 事项 。 尝 握 了 这 些 知识 后 ,我们 在 今后 的 SQL 使 用 过 程 中 束 可 以 利用 本 草 
提 到 的 工具 和 方法 来 提高 SQL 语句 的 效率 ， 同 时 也 为 今后 日 昔 的 SQL 调 优 工作 打下 民 好 
的 基础 。 
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DB2 在 V9.7 的 同时 期 发 行 了 特殊 的 集群 版 本 V9.8， 也 就 是 pureScale 集群 。 从 V10 
开始 ，pureScale 作为 DB2 的 可 选 功能 组 件 ， 和 DPF 一 样 ， 包 含 在 企业 版 和 高 级 企业 版 的 
软件 许可 中 。 本 章 所 说 的 DB2 集群 ， 就 是 专 指 pureScale 特性 。 

DB2 pureScale 集群 就 像 Oracle RAC 技术 ， 是 面 回 OLTP 的 局 可 用 、 可 横 癌 扩展 的 集 
群 解决 方案 。DB2 pureScale 集群 实现 的 技术 和 Oracle RAC 完全 不 同 , 虽然 都 是 共享 存储 
架构 ， 但 在 内 部 的 通信 机 制 上 ， 处 理 机 制 有 很 大 的 区 别 。 所 以 我 们 要 先 了 解 DB2 集群 的 
内 部 工作 机 制 ， 才 能 理解 在 应 用 DB2 集群 过 程 中 会 遇 到 什么 样 的 特殊 问题 。 

本 草 主 要 讲解 如 下 内 容 : 

e DB2 集群 介绍 

DB2 集群 特殊 参数 解析 
DB2 集群 性 能 监控 
DB2 集群 设计 调 优 
同城 双 活 集群 介绍 
同城 双 活 集群 调 优 


10.1 DB2 集群 介绍 


DB2 pureScale 是 同时 兼备 局 扩 展 性 和 高 可 用 性 的 数据 库 集群 ， 同 时 对 于 应 用 是 透明 
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的 。 无 论 连 接 到 集群 内 哪个 成 员 节 上 点， 连接 到 的 都 是 同一 个 数据 库 。 几 10-1 总 结 了 DB2 
集群 的 技术 架构 。 


”运行 于 Power 服务 器 上 的 
DB2 成 员 集 群 
利用 z/OS 提供 的 全 局 锁定 和 
内 存 管理 器 技术 
整合 的 Tivoli System 
Automation 
InfiniBand 网 络 和 DB2 cluster 
Services 


图 10-1 DB2 pureScale 集群 架构 


首先 ，DB2 集 烙 是 共 圣 存储 染 构 ， 每 个 数据 库 处 理 市 点 (成 员 ) 部 可 以 耳 接 操作 磁盘 数 
据 。 共 圣 存 储 使 用 的 是 BM GPFS 集群 文件 系统 。 这 个 集群 文件 系统 是 整个 DB2 集群 的 帮 
层 基础 , 被 DB2 集群 所 管理 , 而 整个 DB2 集群 的 管理 软件 核心 是 Tivoli System Automation 
集群 软件 。TSA 负责 监控 整个 集群 里 面 资 源 的 状态 ， 包 括 存 储 、 网 络 、 进 程 等 ， 并 且 基 于 
这 些 资 源 的 状态 自动 化 相应 的 行为 。 例 如 TSA 监控 到 某 个 节点 的 网 卡 宕 机 ， 就 会 自动 关闭 
当前 节点 的 资源 ， 并 漂移 到 其 他 健康 节点 。 

在 共 邓 存 储 的 基础 上 ， 集 群 内 部 的 通信 对 啊 应 时 间 要 求 很 局 。DB2 pureScale 集群 文 持 
RDMA 协议 和 TCP/IP 协议 。RDMA 协议 相对 速度 更 快 ， 资 源 消 耗 更 小 ， 在 高 性 能 运算 中 
建议 使 用 。 而 TCP/IP 协议 部 区 成 本 低 ， 适 合 于 高 可 用 场景 。 为 了 协调 各 市 点 一 起 服务 同 
一 个 数据 库 ，DB2 集群 内 部 引入 了 CF 功能 ， 这 个 功能 推荐 部 普 为 单独 的 节点 。CF 市 点 主 
要 提供 全 局 锁定 和 内 存 管 理 堪 拉 术 ， 继 承 于 IJBM z/OS 系统 。 现 在 DB2 集群 文 持 Power 服 
务 器 和 X86 服务 器 两 种 开放 式 平 台 。 

DB2 集群 数据 库 处 理 世 点 多 , 对 于 上 层 应 用 来 说 , 客户 哨 可 选 的 连接 方式 也 比较 齐全 。 
主要 运用 的 客户 病 连 接 方式 有 两 种 : 目 动 工作 负载 均衡 和 客户 端 俩 好 设置 。 如 末 使 用 目 动 
工作 负载 均衡 ， 那 么 数据 库 服 务 耸 会 不 断 给 客户 央 反 馈 当 前 的 机 露 下 点 负载 列表 ， 客 户 姗 
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会 基于 此 列表 分 发 事务 ， 而 如 果 选择 客户 端 偏好 设置 ， 那 么 客户 端 会 一 直 连 接 首选 的 数据 
库 成 员 节点 ， 只 有 在 这 个 偏好 的 节点 连接 不 上 时 ， 才 会 自动 连接 预先 设置 的 节点 列表 中 的 
下 一 个 节点 。 这 两 种 方式 各 有 利 整 


10.2 ”DB2 集群 参数 解析 


如 果 想 要 运用 好 DB2 pureScale 人 集群， 首先 要 了 解 CF 而 点 的 功能 。 前 面 说 了 ， 加 入 
CF 入 点 是 为 了 协调 处 理 所 有 成 员 节 点 的 工作 。 其 中 最 核心 的 功能 是 全 局 锁 管 理 舌 (GLML 
Global Lock Manager) 和 组 绥 冲 池 (GBP，Group Buffer Pool)。 


10.2.1 组 缓冲 池 


在 DB2 pureScale 环境 中 ， 集 群 蜗 速 绥 存 设施 提供 了 由 所 有 成 员 共 圣 的 组 缓冲 池 
(GBP)。 每 个 成 员 还 可 管理 目 身 的 一 组 本 地 缓冲 池 (LBP)。 本 地 缓冲 池 其 实 就 相当 于 单机 版 
数据 库 的 缓冲 池 。GBP 是 文 持 所 有 DB2 页 大 小 并 且 所 有 成 员 都 可 使 用 的 单个 缓冲 池 。 成 
员 会 将 页 融 速 缓存 在 它们 目 己 的 LBP 中 ， 并 使 用 GBP 来 维护 成 员 之 间 的 页 一 致 性 。 每 
个 成 员 上 可 存在 不 同 页 大 小 的 LBP( 例 如 ，4KB、8KB、16KB 或 32KB)。 

图 10-2 演示 了 GBP 与 LBP 的 关系 。 


Pages 

而 而 面 画 面 面 画 面 
国名 国 国 回国 一 国 
了 | 


图 10-2 ”GBP 功能 示意 
GBP 存储 两 种 闫 型 的 信息 : 目录 条 目 和 数据 元 系 。 目 录 条 目 存 储 有 天 绥 冲 池 页 的 元 数 
据 信息 ， 数 据 元 素 存 储 页 数据 。 目 录 条 目 与 数据 元 素 的 比例 由 DB2 目 动 调整 。 
因为 每 个 成 员 上 有 LBP 并 且 存 在 由 所 有 成 员 共 享 的 GBP， 上 所 以 同一 页 的 多 个 副本 可 
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存在 于 多 个 组 神 池 中 。 用 于 访问 页 、 更 改 页 以 及 将 更 改 传 播 至 其 他 成 员 的 全 局 并 行 性 和 相 
干 性 控制 由 DB2 缓冲 池 服 务 处 理 。 此 服务 还 会 处 理 缓冲 池 中 的 IO 数据 ， 包 括 将 GBP 中 
的 外 写 全 磁 檀 。 
但 是 为 了 控制 缓 神 池 数 据 的 有 效 性 ， 协 调 不 同 成 员 节点 之 间 的 事务 处 理 和 数据 共 

在 DB2 pureScale 集群 中 引入 了 一 种 新 的 锁定 P-lock。P-lock 控制 DB2 pureScale 环 站 
绥 冲 池 页 的 访问 以 更 新 和 读 取 某 个 页 版 本 。 与 由 特别 事务 拥有 的 做 辑 锁 定 ( 例 如 行 锁定 或 
表 锁 定 ) 不 同 ， 用 于 控制 缓冲 池 页 访问 的 P-lock 由 集群 的 成 员 所 有 。 系 统 使 用 了 以 下 
P-lock: 

e 要 更 新 页 ， 成 员 必 须 以 和 X 和 P-lock。 

e 要 该 取 页 的 最 新 版 本 ， 成 员 必须 以 $ 方式 持 有 P-lock。 

要 谈 取 此 页 的 一 致 版 本 (但 不 一 定 是 最 新 版 本 )， 不 需要 任何 P-lock。DB2 内 部 决定 访 

问 页 时 使 用 哪 种 类 型 的 读 取 。 

以 下 协议 规则 协调 多 个 页 副本 的 相干 性 ; 

e 成 员 将 条 页 访 存 到 其 LBP 中 时 ， 会同 GBP 注册 该 页 

e 尝试 将 某 页 访 存 到 LBP 中 时 ， 成 员 会 先 检查 GBP， 然 后 仅 当 GBP 中 不 存在 此 页 
时 才 从 磁盘 谈 取 此 页 的 内 容 (GBP 中 存在 的 此 页 的 版 本 决 不 会 比 磁 盘 上 此 页 的 版 
本 旧 )。 

e 成 员 具 有 人 针对 某 页 的 更 新 锁定 (X 方式 下 的 P-lock) 时 ， 成 员 的 LBP 中 该 页 的 版 本 
可 能 比 GBP 中 该 页 的 版 本 新 。 

e 在 成 员 释 放 更 新 锁定 (或 降低 P-lock 级 别 ) 之 前 ， 系 统 会 使 用 该 页 的 较 新 版 本 更 新 
GBP. 

e 修改 菏 由 的 事务 结束 (通过 沙 实 或 回 深 ) 时 ， 已 修改 页 会 写 至 GBP。 

e 如 果 另 一 成 员 请 求 P-lock 以 读 取 某 页 的 最 新 版 本 或 更 新 该 页 ， i 
结束 之 前 通过 页 面 协商 将 该 页 写 至 GBP。 另 一 成 员 请 求 P-lock 时 ， 此 锁定 冲突 
导致 拥有 锁定 的 成 员 将 已 修改 页 写 至 GBP 以 便 它 可 释放 P-lock 或 使 其 降级 ， rae 
发 出 请 求 的 成 员 可 请 求 此 锁定 。 

GBP 使 用 的 总 内 存量 由 cf gbp sz 数据 库 配 置 参 数控 制 。 第 一 次 在 成 员 上 激活 数据 库 
时 ， 如 果 CF 上 还 没有 GBP， 那 么 会 分 配 GBP。CF 停止 时 、 数 据 库 在 整个 集群 中 被 删除 
或 一 致 关闭 时 或 在 数据 库 恢 复 操作 期 间 ， 此 GBP 被 释放 。 

释放 操作 会 将 GBP 中 的 页 写 至 磁盘 并 在 成 员 之 间 进 行 协调 。 释 放 操 作 类 似 于 在 LBP 
中 清除 页 并 实现 两 个 功能 : 

e 将 脏 页 与 至 磁盘 以 确保 有 下 够 的 干净 目录 条 目 和 数据 元 素 可 用 于 新 页 注册 和 
SA 入 。 


二 > 
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e 通过 确保 GBP 中 没有 页 的 保留 时 间 超 过 指定 时 间 来 维护 特定 恢复 窗口 。 这 样 做 可 
以 减少 在 恢复 时 要 重演 的 日 志 记 录 数 。 

在 DB2 pureScale 集群 环境 中 ，SOFTMAX 等 控制 缓冲 池 刷 新 脏 数据 的 方式 已 经 失 
效 。 现 在 主要 由 page age tret gcr 和 page age tret mcr 这 两 个 数据 库 配 置 参数 来 控制 释 
放行 为 。 

通俗 地 说 ，GBP 提供 了 集群 全 局 脏 数 据 的 缓冲 池 ， 所 有 的 脏 数 据 部 会 先 存 放 到 GBP， 
再 通过 一 定 的 规则 从 GBP 持久 化 到 磁盘 。GBP 还 要 标记 所 有 成 员 节 点 的 本 地 缓冲 池 数 据 
是 从 有效。 成 员 市 点 事 务 访问 数据 时 ， 背 先 检查 本 地 缓冲 池 数 据 的 有 效 性 ， 然 后 从 GBP 
获取 最 新 的 已 经 提 有 区 的 数据 ， 最 后 才 从 存储 恋 取 数据 。 


10.2.2 全 局 锁 管 理 器 


类 似 于 组 缓冲 池 与 本 地 绥 冲 池 的 关系 ，DB2 pureScale 集群 内 部 具有 岗 种 锁 管 理 右 : 本 
地 锁 管理 器 (LLM) 和 全 局 锁 管理 器 (GLM)。 这 两 种 锁 管理 器 一 起 协作 处 理 整 个 集群 内 部 的 
并 发 控制 。 本 地 锁 管 理 器 在 每 个 成 员 节 点 上 ， 为 当前 成 员 的 事务 处 理 锁 请 求 ， 它 维护 的 是 
当前 成 员 节 点 上 的 应 用 和 事务 ， 而 全 局 锁 管 理 器 (GLM) 是 CF 节点 上 的 功能 组 件 ， 处 理 的 
是 所 有 成 员 节 点 上 本 地 锁 管 理 器 (LLM) 的 申请 ， 所 以 GLM 维护 了 所 有 成 员 节 点 的 锁 请 求 。 
当 一 个 事务 申请 锁 时 ， 这 些 锁 是 通过 LLM 和 GLM 协调 而 获取 的 。 

LLM 和 GLM 的 交互 是 通过 RDMA 协议 完成 的 ， 并 且 都 在 内 存 里 进行 ， 所 以 沟通 的 
成 本 并 不 算 高 。 前 面 说 到 了 P-lock 是 pureScale 环境 中 一 种 新 的 锁 ， 而 且 还 是 所 谓 的 物理 锁 。 
如 条 两 个 成 员 在 修改 同一 个 数据 页 的 不 同行 数据 ， 也 会 导致 这 个 数据 页 物理 锁 的 竞争 。 而 
这 种 竞争 行为 并 不 是 一 直 对 立 ， 而 是 导致 一 种 锁 回 收 的 行为 。 

假设 成 员 1 的 事务 A 拥有 这 个 P-lock， 修改 了 一 行 数据 ， 成员 2 的 事务 B 想 要 申请 同 
样 的 P-lock， 写 男 外 一 条 数据 。 事 务 B 并 不 需要 一 直 等 到 事务 A 提交 并 释放 这 个 锁 ， 而 是 
通过 和 CF 交互 , 让 事务 A 与 完 日 志 ， 并 且 等 待 成员 1 将 数据 页 的 脏 数 据 写 入 CF 的 GBP， 
那么 这 时 事务 B 就 可 以 获取 这 个 P-lock 并 从 GBP 获取 最 新 版 本 的 数据 页 以 进行 下 一 步 操 
作 。 这 种 行为 称 为 页 回收 ， 也 被 称 为 锁 回 收 。 在 监控 和 调 优 DB2 集群 的 过 程 中 ， 这 种 行为 
的 代价 很 高 ， 需 要 特别 关注 并 调 优 。 


10.2.3 DB2 pureScale 集群 相关 参数 


这 里 只 列 出 pureScale 相关 参数 以 及 对 pureScale 性 能 有 影 啊 的 参数 。 


425 


426 


DB2 数据 库 性 能 调整 和 优化 (第 3 版 ) 


1. 注册 表 变 量 


DB2 ALLOW WLB WITH SEQUENCES 注册 表 变 量 控制 是 否 允 许 用 来 访问 序 
列 的 应 用 程序 参与 工作 负载 均衡 。 当 DB2 ALLOW WLB WITH SEQUENCES 
设置 为 NO 时 ， 会 阻止 在 SQL 序列 语句 中 引用 PREVIOUS VALUE 或 NEXT 
VALUE 的 应 用 程序 参与 工作 负载 均衡 。 默 认 是 NO， 建 议 设置 为 YES。 

DB2 DATABASE CF MEMORY 用 于 指示 将 cf db mem sz 数据 库 配 置 参 数 设 置 
为 AUTOMATIC 的 每 个 数据 库 的 总 CF 内 存 (CF MEM SZ) 比 例 。cf db mem sz 
被 设置 为 特定 值 的 任何 数据 库 将 忽略 此 注册 表 变 量 。 这 个 变量 初始 建议 设置 为 -1， 
那么 数据 库 在 cf db mem sz 设置 为 目 动 的 情况 下 ， 目 动 获取 的 大 小 为 
CF MEM SZ/NUMDB ， 而 cf db mem sz 建议 设置 为 固定 值 ， 以 窗 瘟 
DB2 DATABASE CF MEMORY 设置 。 

DB2 MCR RECOVERY PARALLELISM CAP: 在 多 数据 库 环 境 中 ， 如 果 需 要 成 
员 崩 尝 恢 复 (MCR)， 那 么 在 每 个 成 员 上 并 行 恢复 的 数据 库 数 由 numdb 配置 参数 
或 DB2 MCR RECOVERY PARALLELISM CAP 注册 表 变 量 的 值 (两 者 中 的 较 
小 省) 放置 。 

DB2 SD ALLOW SLOW NETWORK 变量 允许 小 于 10GE 的 以 太 网 卡 使 用 
cf transport method 配置 参数 的 TCP 选项 。 这 种 具有 较 低 传输 速率 的 以 太 网 卡 会 
限制 性 能 。 一 般 只 有 在 测试 环境 或 开 司 了 EHL 的 pureScale 集群 生产 环境 中 才 使 
用 小 于 10GE 的 以 太 网 卡 。 


2 实例 变量 


LE 


CF MEM SZ 参数 控制 集群 高 速 缓存 设施 (又 称 为 CF) 使 用 的 总 内 存 。 如 果 应 用 默 
认 设 置 为 AUTOMATIC, 堵 么 集群 嵩 速 绥 存 设施 的 内 存量 通过 会 询 CF 服务 郁 上 
可 用 的 总 内 存 确 定 。 然 后 此 参数 被 设 为 CF 服务 器 上 总 内 存 的 适当 百分比 或 机 器 
上 的 可 用 内 存量 ( 取 两 者 中 的 较 小 值 )。 适当 百分比 通常 为 CF 上 可 用 总 内 存 的 70% 
到 90%。 建 议 设置 为 固定 值 。 

cf num conns 参数 控制 集群 高 速 缓存 设施 (CE) 连 接 池 的 初始 大 小 。 如 宁 将 
cf num conns 参数 设 为 固定 数字 值 ， 那 么 对 于 每 个 CFE，DB2 数据 库 管理 器 会 在 
每 个 成 员 启 动 时 为 该 成 员 创 建 正 好 等 于 该 数目 的 CF 连接 。DB2 数据 库 管理 器 不 
会 进行 任何 目 动 增长 或 缩减 。 建 议 体 持 默认 什 AUTOMATIC， 

cf num_ workers 参数 指定 集群 局 速 缓存 设施 (CCF) 上 的 工作 程序 线程 总 数 。 工 作 程 
序 线程 分 布 在 多 个 通信 适配器 端口 之 间 以 平衡 每 个 接口 上 用 于 处 理 请 求 的 工作 程 
序 线程 数 。 如 果 设 为 默认 值 (AUTOMATIC)， 那 么 参数 值 配 置 为 CF 上 的 可 用 处 理 
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硕 数 减 1。 可 用 CPU 在 和 实例 间 平 均 划 分 ， 然 后 从 针对 每 个 实例 生成 的 值 中 减 一 个 
处 理 器 。 如 宋 CF 主机 上 有 共存 成 员 , 那么 CF 上 的 工作 程序 线程 数 进一步 除 以 主 
机 上 的 CF 和 成 员 的 总 数 。 如 宁 CF 服务 需 上 只 有 一 个 处 理 上 器， 那么 此 值 设 为 1。 
CF 工作 程序 线程 总 数 显示 在 cfdiag.log 文件 中 。 如 果 手 动 设置 cf num workers 参 
数 ， 请 将 该 人 设置 为 等 于 或 大 于 通信 适 配 堪 端 口 数 以 便 每 个 接口 全 少 有 一 个 工作 
程序 线程 。 如 条 工作 程序 线程 数 不 足 以 罗 闸 所 有 接口 ， 那 么 系统 会 针对 局 动 失败 
的 CF 记录 警报 。 必 须 更 改 该 参数 值 才能 解决 此 问题 。 在 使 用 TCP/IP 作为 通信 方 
式 的 DB2 pureScale 环境 中 ， 当 cf num workers 设置 为 默认 值 (AUTOMATIC) 时 ， 
会 将 参数 人 配置 为 实例 上 可 用 处 理 咒 数 的 四 倍 。. 如 果 正 运行 mnfiniBand 或 uDAPL， 
请 不 要 将 此 值 设 为 大 于 CF 服务 器 上 的 处 理 器 数 。 每 个 工作 程序 线程 在 一 个 处 理 
船上 运行 以 等 待 UDAPL 通信 。 如 果 工 作 程序 线程 数 超过 处 理 需 数 , 那么 性 能 会 受 
影响 。 如 果 CF 节点 有 其 他 服务 ， 就 设 定 为 固定 值 ， 值 的 大 小 为 节点 CPU 数 减 去 
想 要 保留 的 CPU 数 。 

cf transport method 配置 参数 控制 将 哪 种 方法 用 于 在 DB2 成 员 与 集群 局 速 缓存 
工具 (CF) 之 间 进 行 通信 。 当 cf transport method 设置 为 RDMA 时 , DB2 成 员 必须 
通过 使 用 Remote Direct Memory Access (RDMA) 来 与 CF 通信 。 要 使 用 RDMA 协 
议 网 络 ， 必 须 使 用 的 硬件 配置 是 安装 了 相应 InfiniBand 硬件 的 InfiniBand 网 络 或 
是 使 用 RoCE 适 配 卡 的 以 太 网 网 络 。 当 cf transport method 参数 设置 为 TCP 时 ， 
DB2 成 员 通 过 使 用 TCP/IP 协议 网 络 来 与 CF 通信 。 

cf diagpath 指定 CF 的 诊断 信息 文件 的 标准 路 径 ， 默 认 是 在 “INSTHOME/sqllib/ 
db2dump/ $m” 下 面 。 建 议 修 改 ， 不 要 放 在 GPFS 文件 系统 和 实例 目录 下 。 同 样 ， 
对 diagpath 也 建议 如 此 。 

cf diaglevel 参数 指定 将 记录 在 cfdiag*.log 文件 中 的 诊断 铬 误 突 型 ， 默 认为 2， 记 
录 所 有 错误 。 不 建议 修改 。 


3. 数据 库 变 量 


cf db mem sz 参数 控制 此 数据 库 的 集群 融 速 缓存 设施 ( 义 称 为 CF) 的 总 内 存 限制 。 
cf gbp sz、cf lock sz 和 cf sca sz 参数 的 集群 高 速 缓存 设施 (CP) 结 构 内 存 限制 之 
和 必须 小 于 cf db mem sz 参数 的 CF 结构 内 存 限制 。 在 cf db mem sz 参数 绑 定 
的 同一 数据 库 内 的 CF 资源 (例如 组 缓冲 池 (GBP)、 共 享 通信 区 (SCA) 和 锁定 结构 ) 
之 辣 目 动 调 整 内 存 。 如 条 设置 为 固定 值 ， 需 要 知道 有 额外 3840 个 4KB 页 ( 取 目 
cf mem sz 参数 ) 将 由 CF 内 部 使 用 。 此 外 ，cf mem sz 参数 中 会 额外 保留 256 个 
4KB 页 以 供 实例 中 的 每 个 活动 数据 库 使 用 。 建 议 设 定 为 固定 值 。 
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cf gbp sz 参数 确定 集群 高 速 缓存 设施 (又 称 为 CF) 用 于 此 数据 库 的 组 缓冲 池 
(GBP) 的 内 存 大 小 。 建 议 设 置 为 固定 值 ， 大 小 为 所 有 成 员 节 点 LBP 之 和 的 30% 一 
4090 。 

cf lock sz 参数 确定 CF 用 于 此 数据 库 的 锁定 的 内 存 大 小 。 建 议 设置 为 固定 值 。 可 
使 用 current cf lock size 监视 元 又 来 监视 CF 锁定 内 存 的 消耗 。 

cf sca sz 参数 确定 集群 高 速 缓存 设施 (CF) 中 SCA 使 用 的 内 存 大 小 。 该 SCA 对 应 
每 个 数据 库 实 体 ， 并 且 包 含 表 、 索 引 、 表 空间 和 目录 的 数据 库 范 围 控 制 块 信息 。 
此 参数 可 联机 配置 ， 建 议 使 用 默认 值 AUTOMATIC。DB2 数据 库 管 理 器 会 在 对 
任何 成 员 第 一 次 激活 数据 库 时 计算 内 存 值 ， 此 值 应 足以 供 基 本 数据 库 操 作 使 用 。 
page age trgt_mcr 参数 指定 在 将 已 更 改 的 页 面 持久 存储 到 表 空 间 存 储 器 (或 者 对 
于 DB2 pureScale 实例 , 持久 存储 到 表 空 间 存 储 器 或 组 绥 冲 池 ) 之 前 要 在 本 地 绥 评 
池 中 保留 这 些 页 面 的 目标 持续 时 间 ( 以 秒 计 )。 当 softmax 参数 配置 为 值 0 时 ， 会 
使 用 page age trgt mcr 参数 。 已 迁移 的 数据 库 会 保留 softmax 的 上 一 个 值 ， 并 
日 忽略 page age trgt mcr 参数 (如 果 此 值 不 是 0)。 在 新 数据 库 中 ，softmax 的 值 
被 设置 为 0。 当 softmax 参数 设置 为 0 时 ，page age trgt mcr 参数 用 于 确定 软 
检查 点 的 频率 。 增 大 此 配置 参数 的 值 会 将 已 更 改 的 页 面 在 内 存 中 保留 更 入， 从 而 
允许 在 将 这 些 页 和 面 持久 存储 到 磁盘 之 前 绥 冲 更 多 页 和 面 更 新 。 此 行为 可 帮助 提高 性 
能 ， 但 是 也 会 延长 恢复 时 间 。 

page age trgt_gcr 参数 指定 在 将 已 更 改 的 页 面 持久 存储 到 磁盘 或 高 速 绥 存 设施 之 
亲 ,， 要 在 组 绥 冲 池 中 你 留 这 些 页 和 面 的 目标 持续 时 间 ( 以 秒 计 )。page age trgt gcr 参 
数 必须 大 于 或 等 于 page_age trgt_mer 数据 库 配 置 参数 。 当 softmax 参数 配置 为 
值 0 时 ， 会 使 用 page age trgt gcr 参数 。 已 迁移 的 数据 库 会 保留 softmax 的 上 
一 个 值 ， 并 且 忽 略 page age trgt gcr 参数 (如 果 此 值 不 是 0)。 在 新 数据 库 中 ， 
softmax 的 值 被 设 置 为 0。 增 大 此 配置 参数 的 值 会 将 已 更 改 的 页 和 面 在 内 存 中 你 留 更 
入 ， 从 而 允许 在 将 这 些 页 面 持久 存储 到 磁盘 之 前 缓冲 更 多 页 面 更 新 。 此 行为 可 帮 
助 提高 性 能 ， 但 是 也 会 延长 恢复 时 间 。 

softmax 参数 被 奉 换 为 新 的 page age tret mcr 和 page age tret gcr 参数 (这 两 个 
参数 都 配置 为 几 秒 )， 所 以 在 pureScale 环境 中 这 个 值 为 0。 

opt_direct_wrkld 参数 局 用 或 茶 用 显 式 分 层 锁定 (EHL)。opt direct_ wrkld 参数 指定 
表 或 范围 分 区 是 否 有 资格 进入 NOT SHARED 状态 。 它 全 局 适用 于 所 有 DB2 
pureScale 成 员 。 进 入 NOT SHARED 状态 的 表 ， 会 保持 处 于 此 状态 ， 下 到 男 一 
成 员 访 问 该 表 。 在 实际 运用 中 表 状 态 的 改变 过 程 存在 性 能 下 降 问 题 ， 所 以 不 建议 
在 多 节点 访问 的 生产 环境 中 使 用 。 除 非 仅 仅 把 pureScale 当 作 闹 可 用 集群 ， 应 用 指 
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定 世 点 访问 ， 其 他 天 点 为 热 备 状态 的 特殊 场景 。 这 种 情况 下 放置 此 参数 为 ON， 
能 减少 与 CF 太 点 的 交互 ， 获 取 更 玉 的 性 能 。 


10.3 DB2 集群 性 能 监控 


DB2 集群 的 所 有 事务 处 理 都 和 单机 版 不 一 样 ， 无 论 是 数据 的 访问 还 是 锁 的 申请 ， 都 需 
要 和 CF 交互 。 所 以 在 DB2 集群 调 优 过 程 中 ， 最 需要 关注 的 就 是 这 些 不 一 样 的 地 方 。DB2 
集群 加 入 了 很 多 新 的 监控 指标 和 监控 工具 , 下面 就 一 步 步 看 如 何 监 控 DB2 集群 的 性 能 并 加 
以 优化 。 


10.3.1 查看 CF 资源 利用 


CF 市 点 的 系统 资源 已 经 预先 分 配 ，cf num workers 参数 控制 系统 CPU 资源 占用 ， 
CF_MEM_SZ 控制 系统 内 存 占 用 。 

因为 DB2 集群 的 CF 节点 会 一 直 占 用 操作 系统 CPU， 而 在 DB2 集群 内 部 ， 这 些 CPU 
资源 是 否 充 足 ,可 以 通过 查询 SYSIBMADM.ENV_CF_SYS_RESOURCES 来 获取 实际 用 量 。 


SELECT VARCHAR (NAME,20) AS ATTRIBUTE, VARCHAR (VALUE,22) AS VALUE ， 
VARCHAR (UNIT,8) AS UNIT FROM SYSTIBMADM.ENYV CF SYS RESOURCES 


答 出 结 末 如 图 10-3 所 示 : 


ATTRIBUITE VALUE UNJT 
HOST_NAME AGDPCCF1 一 
MEMORY_TOTAL 30720 MB 
MEMORY_FREE 18804 MB 
MEMORY_SWAP_TOTAL 16384 MB 
MEMORY_SWAP_FREE 16351 MB 
VIRTUAL_MEM_TOQOTAL 47104 MB 
VIRIUAL_MEM_FREE 351 56 MB 
CPU_UsAGE_TOTAL 0 PERCENT 
HOST_NAME BGDPCCF1 
MEMORY_TOQOTAL 307 20 MB 
MEMORY_FREE 1]9502 MB 
MEMORY_SWAP_TOTAL 1] 6384 MB 
MEMORY_SWAP_FREE 1]06332 MB 
VIRIUAL_MEM_ITOQTAL 47104 MB 
VIRTUAL_MEM_FREE 33833 MB 
CPU_USAGE_TOTAL 0 PERCENT 


图 10-3 ”CF 资源 利用 
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这 个 管理 视图 显示 了 CF 节点 上 的 内 存 和 实际 CF 占用 的 CPU 量 。 其 中 ，CPU 实际 使 
用 量 和 在 操作 系统 里 面 看 到 的 是 不 一 样 的 。 一 般 CPU USAGE TOTAL 在 主 CF 节点 的 值 
会 略 大 于 在 备 CF 节点 的 值 。 主 CF 节点 的 这 个 值 也 不 会 很 高 ， 一 般 在 10% 以 内 ， 繁 忙 的 
时 候 也 不 会 超过 30%。 但 是 如 果真 的 过 到 性 能 问题 ， 尤 其 是 和 CF 交互 相关 的 性 能 问题 ， 
这 个 值 可 能 瞬间 会 比较 高 。 这 种 情况 下 就 需要 分 析 当 前 的 事务 性 能 。 CF 交互 主要 就 是 庶 写 
数据 页 、 申 请 和 释放 锁 等 。 当 出 现 热点 数据 或 者 进行 大 量 数据 处 理 的 时 候 ， 这 个 值 可 能 会 


10.3.2 ”查看 各 个 成 员 的 负载 情况 


DB2 集群 内 多 个 成 员 节 点 同时 提供 数据 库 服务 。 应 用 服务 器 可 以 通过 开局 工作 负载 均 
衡 (WLM) 的 方式 由 DB2 集群 协调 负载 分 友 , 充分 利用 系统 资源 。 当 然 也 可 以 通过 指定 访问 
的 成 员 ， 或 是 完全 轮 询 访问 成 员 贡 点 来 分 发 负载 。 无 论 使 用 哪 一 种 方式 ， 数 据 库 管理 员 都 
希望 能 清楚 知晓 DB2 集群 内 部 的 工作 负载 实际 状态 。db2pd 工具 捉 供 了 相关 监 指标 ， 丛 看 
serverlist， 输 出 结果 如 图 10-4 所 示 : 
AGDPCMB1 : /home/db2gdpc$db2pd -gd chgmdb -server 115T 
Database Member 0 -- Active -- Up 0 days 02:42:17 -- Date 2017-04-12-14.16.41.803102 
server List: 

ar Name : ES En 


Member subset Id: 0 
Member subset Name: SYSDEFAULTMEMBERSUBSET 
4 


Count : 

Member Hostname Non-ssL Port SSL Port Priority 
0 AGDPCMB]1 50000 0 61 

了 BGDPCMB2 30000 0 100 

1 AGDPCMB2 50000 0 77 

2 BGDPCMB1 50000 0 86 


图 10-4 ”集群 负载 情况 


在 这 个 输出 结 朱 中 主要 关注 Priority 值 , 越 大 说 明 越 空闲 , 越 小 说 明 越 肾 忙 。 如 来 是 0， 
通 币 衣 示 对 应 的 节 操 不 可 用 。 这 个 值 是 瞬间 值 ， 通 第 邦 不 会 很 平均 ， 需 要 持续 观察 才能 确 
定 负载 分 布 是 个 均衡 。 


10.3.3 ”查看 缓冲 池 命 中 率 


DB2 集群 内 部 有 全 局 缓冲 池 和 本 地 缓冲 池 ， 监 控 指 标 也 多 了 很 多 项 。 通 常 在 单机 版 数 
据 库 环境 中 ， 和 需要 通过 计算 缓冲 池 的 命中 率 来 分 析 是 否 存在 性 能 问题 ， 无 论 是 缓冲 池 设 置 
过 小 ， 还 是 发 生 了 昂贵 的 大 查询 。 这 些 是 计算 缓冲 池 命 中 率 的 意义 ， 因 为 在 缓冲 池 找 到 数 
据 比 从 磁盘 读 取 到 数据 的 成 本 低 很 多 。 在 DB2 集群 环境 内 ， 应 用 访问 需要 先 访问 LBP 来 
尝试 获取 数据 ， 如 果 没 有 找到 ， 那 么 再 去 GBP 尝试 获取 数据 。 如 果 都 没有 ， 最 后 才 是 从 磁 
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盘 获 取 。 访问 GBP 是 通过 RDMA 协议 从 CF 节点 远程 获取 , 时 间 大 约 是 30 纳 秒 (如 果 不 是 
同城 双 活 GDPC 环境 )。 这 个 速度 相对 于 从 磁盘 获取 数据 是 相当 快 的 ， 几 乎 约 等 于 从 LBP 
获取 到 了 数据 。 所 以 要 计算 组 神 池 的 命中 率 来 判断 是 否 存 在 物理 谈 太 多 的 问题 ， 应 该 计算 
从 LBP 加 上 GBP 获取 到 的 次 数 后 除 以 全 部 获取 次 数 。 
在 此 之 前 最 先 要 了 解 的 是 监控 指标 的 含义 。 下 面 列 出 缓冲 池 相 关 的 监控 指标 : 
e pool data 1 reads 监视 元 背 指示 从 第 规 表 空间 和 大 型 表 衬 间 的 饮 辑 缓冲 池 中 请 求 
获取 的 数据 页 的 数目 。 
e pool data p reads 监视 元 篆 指 示 从 第 规 表 空间 和 大 型 表 衬 间 的 物理 表 空 间 容 需 中 
谈 取 的 数据 页 数 。 
e pool data lbp pages_ found 监视 元 素 指 示 数 据 页 出 现在 本 地 绥 神 池 中 的 次 数 。 
e pool data gbp indep pages found in lbp 监视 元 系 指 示人 代理 程 序 在 本 地 缓冲 池 (LBP) 
中 发 现 的 独立 于 组 缓冲 池 (GBP) 的 数据 负数。 在 DB2 pureScale 环境 外 部 ， 此 值 
pe 
e pool data gbp invalid pages 监视 元 素 指 示 数 据 页 在 本 地 缓冲 池 中 无 效 并 因此 改 
为 从 组 绥 冲 池 中 话 取 的 次 数 。 在 DB2 pureScale 环境 外 部 ， 此 值 为 空 。 
e pool data gbp 1 reads 监视 元 素 指 示 尝 试 从 组 绥 冲 池 读 取 依 赖 于 组 缓冲 池 (GBP) 
的 数据 页 (因为 该 页 在 本 地 缓冲 池 (LBDP) 中 无 效 或 不 存在 ) 的 次 数 。 在 DB2 pureScale 
环境 外 部 ， 此 值 为 宇 。 
e pool data gbp p reads 监视 元 系 指 示 和 莹 试 将 磁盘 中 依赖 于 组 绥 神 池 (GBP) 的 数据 
页 讯 取 a 到 本 地 绥 冲 池 中 (因为 在 GBP 中 找 不 到 该 页 ) 的 次 数 。 在 DB2 pureScale 环 
境外 部 ， 此 全 为 空 。 
e pool async data reads 监视 元 素 指 示 异 步 引 擎 可 派 遗 单元 (EDU) 从 所 有 类 型 的 表 
空间 的 物理 表 衬 间 容 堪 中 谈 取 的 数据 页 数 。 
e pool async data lbp pages found 监视 元 到 指示 预 取 程序 尝试 访问 数据 页 时 此 数 
据 页 出 现在 本 地 缓冲 池 中 的 次 数 。 
e pool async data gbp indep pages found in lbp 监视 元 素 指 示 本 地 缓冲 池 中 由 异 
步 EDU 发 现 的 独立 于 组 绥 冲 池 (GBP) 的 数据 页 数 。 
e pool async data gbp invalid pages 监视 元 系 指 示 预 取 程 序 和 尝试 从 组 绥 神 池 旋 取 数 
据 页 (因为 该 数据 页 在 本 地 绥 冲 池 中 无 效 ) 的 次 数 。 在 DB2 pureScale 环境 外 部 ， 此 
e pool async data_gbp 1] reads 监视 元 又 指示 预 取 程 厅 竹 试 从 组 绥 冲 池 读 取 依 赖 于 
组 绥 冲 池 (GBP) 的 数据 页 (因为 该 页 在 本 地 绥 冲 池 中 无 效 或 不 存在 ) 的 次 数 。 在 
DB2 pureScale 环境 外 部 ， 此 值 为 宇 。 
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pool async data gbp p reads 监视 元 素 指示 预 取 程序 答 试 将 们 盘 中 依赖 于 组 绥 许 
池 (GBP) 的 数据 页 旋 取 到 本 地 绥 冲 池 中 (因为 在 GBP 中 找 不 到 该 数据 页 ) 的 次 数 。 
在 DB2 pureScale 环境 外 部 ， 此 值 为 空 。 

pool index 1 reads 监视 元 素 指 示 从 弟 规 表 空 间 和 大 型 表 空间 的 逻辑 绥 冲 池 中 请 来 
获取 的 索引 页 数 。 

pool index p reads 监视 元 素 指 示 从 第 规 表 空 间 和 大 型 表 衬 间 的 物理 表 空 间 容 夫 
中 读 取 的 索引 页 数 。 

pool index_lbp_pages_found 监视 元 素 指示 索引 员 出 现在 本 地 缓冲 池 中 的 次 数 。 
pool index gbp indep pages found in lbp 监视 元 素 指 示 代 理 程 序 在 本 地 绥 冲 池 
(LBP) 中 发 现 的 独立 于 组 缓冲 池 (GBP) 的 索引 页 数 。 在 DB2 pureScale 环境 外 部 ， 
pool index gbp_invalid pages 监视 元 紊 指示 笠 试 从 组 绥 冲 池 话 取 过 引 页 (因为 该 数 
据 页 在 本 地 绥 冲 池 中 无 效 ) 的 次 数 。 在 DB2 pureScale 环境 外 部 ， 此 值 为 宇 。 

pool index gbp 1 reads 监视 元 又 指 示 笠 试 从 组 缓冲 池 斌 取 依 赖 于 组 绥 冲 池 (GBP) 
的 索引 页 (因为 该 数据 页 在 本 地 绥 冲 池 中 无 效 或 不 存在 ) 的 次 数 。 在 DB2 pureScale 
环境 外 部 ， 此 值 为 空 。 

pool index gbp_p_reads 监视 元 系 指 示 答 试 将 磁盘 中 依赖 于 组 绥 神 池 (GBP) 的 么 引 
页 讯 取 a 到 本 地 绥 冲 池 中 (因为 在 GBP 中 找 不 到 该 数据 页 ) 的 次 数 。 在 DB2 pureScale 
环境 外 部 ， 此 值 为 空 。 

pool async index reads 监视 元 系 指 示 异 步 引 擎 可 浅 息 单元 EDU) 从 所 有 类型 的 表 
空间 的 物理 表 空 间 容 堪 中 谈 取 的 索引 页 数 。 

pool async index lbp pages found 监视 元 素 指 示 预 取 程 序 笠 试 访问 索引 页 时 此 有 索 
引 页 出 现在 本 地 缓冲 池 中 的 次 数 。 

pool async index gbp indep pages found in lbp 监视 元 素 指示 本 地 缓冲 池 中 由 异 
步 EDU 发 现 的 独立 于 组 绥 冲 池 (GBP) 的 索引 页 数 。 

pool async index gbp_invalid pages 监视 元 素 指 示 预 取 程序 尝试 从 组 缓冲 闻 读 取 
索引 贝 ( 因 为 该 数据 页 在 本 地 绥 冲 池 中 无 效 ) 的 次 数 。 在 DB2 pureScale 环境 外 部 ， 


pool async index gbp 1 reads 监视 元 素 指 示 预 取 程 序 答 试 从 组 绥 神 池 旗 取 依 赖 于 
组 绥 补 池 (GBP) 的 索引 页 (因为 该 数据 页 在 本 地 组 神 池 中 无 效 或 不 存在 ) 的 次 数 。 在 
DB2 pureScale 坏 境外 部 ， 此 值 为 守 。 
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e pool async index gbp p reads 监视 元 素 指 示 预 取 程 序 尝 试 将 磁 擅 中 依赖 于 组 绥 冲 
池 (GBP) 的 索引 页 面谈 取 到 本 地 绥 冲 池 中 (因为 在 GBP 中 找 不 到 该 数据 页 ) 的 次 数 。 
在 DB2 pureScale 环境 外 部 ， 此 值 为 空 。 

。 pool temp_data_ 1 reads 监视 元 素 指示 向 临时 表 空 间 的 逻辑 缓冲 池 请 求 的 数据 


e pool temp_data p reads 监视 元 系 指 示 从 临时 表 空 间 的 物理 表 空 间 容 需 中 谈 取 的 
数据 页 数 。 
e pool temp index 1 reads 监视 元 素 指示 回 临 时 表 空 间 的 滥 辑 缓冲 池 请 求 的 索引 


e pool temp_index p_ reads 监视 元 率 指 示 从 临时 表 空 间 的 物理 表 空 间 容 和 右 中 旋 取 的 
系 引 页 数 。 
下 面 通过 图 10-5 来 了 解 上 述 参数 的 意义 ， 以 data 为 例 : 


Found in Invalid in Not in LBP， Not in LBP or GBP, 
LBP LBP, found found in found on disk 
in GBP GBP 


Pool data lbp _pages found 


图 10-5 ”监控 元 素 示例 


图 10-5 中 显示 了 获取 数据 的 流程 和 相应 的 监控 元 时 计数 鼎 灾 化 。 其 中 本 地 缓冲 池 找 到 
对 应 的 数据 页 元 素 pool data lbp pages found 包含 了 本 地 缓冲 池 找 到 的 有 效 和 无 效 数 据 
页 ， 也 就 是 包 售 pool data gbp invalid pages 监视 元 素 ; 而 pool data gbp p reads 和 
pool data p_reads 监视 元 素 应 该 是 几乎 一 致 的 ， 都 是 从 本 地 缓冲 池 LBP 和 组 缓冲 池 GBP 
没有 找到 数据 页 而 发 生 了 物理 恋 。 获 取 到 数据 页 的 成 本 是 LBP<GBP< 人 磁盘 。 上 和 面 这 个 示意 
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图 并 没有 区 分 同步 读 和 异步 读 , 而 是 包含 了 这 两 种 情况 。 寞 步 读 是 DB2 引擎 帮助 预先 读 取 
再 要 的 数据 页 到 缓冲 池内 ， 这 样 应 用 实际 访问 的 时 候 从 缓冲 池 获 取 的 概率 更 局 ， 提 高 了 命 
中 率 。 而 应 用 访问 数据 的 缓冲 池 命 中 率 是 最 应 该 关心 的 。 所 以 计算 缓冲 池 命 中 率 的 时 候 ， 
建议 去 掉 异 步 谈 产生 的 偏 莽 。 也 就 是 只 要 不 发 生 同 步 恋 ， 就 相当 于 在 缓冲 池 命 中 了 。 但 是 
异步 读 里 面包 含 了 常规 表 空 间 和 临时 表 空 间 的 数据 读 。 

这 些 监控 元 素 可 以 从 不 同 的 维度 收集 : 表 空 间 、 缓 冲 池 和 数据 库 。 建 议 使 用 DB2 提供 
的 表 函 数 来 收集 。 这 些 表 函 数 包 括 MON GET BUFFERPOOL、MON GET DATABASE、 
MON GET DATABASE DETAILS 和 MON GET TABLESPACE. 


1. 数据 同步 读 公 式 
数据 的 同步 读 要 去 掉 异 步 读 计 数 器 : 


数据 同步 读数 量 = Pool data Pp reads + pool temp datla p reads — 


BoOoL 3sYync data Teads 


所 以 这 里 建议 临时 表 空 间 使 用 单独 的 缓冲 池 ， 这 样 就 能 确切 知道 数据 请 求 的 缓冲 池 命 
中 率 是 什么 了 ， 而 数据 表 空 间 对 应 的 缓冲 池 pool temp data p reads 监控 元 素 将 是 0。 但 是 
如 果 临 时 表 空 间 使 用 了 同样 的 缓冲 池 ， 在 计算 命中 率 的 时 候 还 是 要 考虑 临时 表 空间 访问 的 
影 啊 。 


2. 整体 缓冲 池 命 中 率 公 式 
以 数据 页 的 访问 为 例 ， 数 据 整 体 缓冲 池 的 命中 率 如 下 所 示 : 


整体 缓冲 池 命 中 率 = (pool data 1 reads +- Beool temp data | reads ~ 
(BOOL data pp reads 一 pool asyne data reads}) / (pool data 1 reads + 
Pool temp datla SULTSeads) 


下 面 这 个 例子 是 通过 MON GET BUFFERPOOL 表 函 数 检 查 所 有 缓冲 池 在 所 有 节点 的 
数据 页 整体 命中 率 : 

~> db2 "SELECT MEMBER, VARCHAR({bp name, 20)AS bp name, 

> DEC((Iloatlpool data 1 reads + pool temp data | reads — 
(pool data p reads - pool async data reads))/ float(pool data 1 reads + 
pool temp data | Teads}}* TOD 5S. 2 DATA OVERALG HIT 

> FROM TABLE (MON GET BUFFERPOOL('', -2)) where bp name not like "IBMSYSS" 


and pool data 1 reads > 0 order by member,bp name- 
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MEMBER BP NAME, DATA OVERALL HIT 
0 IBMDEFAULTBP 99. BT1 
] IBMDEFAULTBP SR 


2 record(s) selected. 
索引 的 整体 缓冲 池 命 中 率 与 此 相似 ， 蔡 换 公式 中 的 data 为 index 即 可 : 


数据 整体 缓冲 池 命 中 率 = (pool index 1 reads + pool temp index 1 reads - 
(Pool index p reads - pool async index reads)) / (pool index 1 reads + 


PooU tem ndex Weeads) 

同样 通过 MON GET BUFFERPOOL 表 函 数 检查 所 有 绥 冲 池 在 所 有 节点 的 案 引 页 的 整 
体 命中 率 : 

~> db2 "SELECT MEMBER, VARCHAR (bp name, 20}AS bp name, 

> DEC((IfEIGat(pool ndex 1 Yeads pool temp index T reads 二 
(Pool ndex pp reads — pool async index reads}})/ TIoat {pool index | reads + 
pool temp index 1 Feads))* 100, 5, 2) IDX OVERALL HIT 

> FROM TABLE {MON GET BUFFERPOOL(' § -2)) where bp name Po 11Ke "IBMSYSS" 


and pool index | reads > 0 order by memnber bp name” 


MEMBER BP NAME, IDX OVERALL HIT 
0 IBMDEFAULTBP 二 
1] IBMDEFAULTBP | 


2 record(s) selected. 


对 于 使 用 比较 频繁 的 缓冲 池 ， 数 据 的 缓冲 池 命 中 率 期 望 大 于 90%， 索 引 的 缓冲 池 命 中 
率 期 望 大 于 9$%， 否 则 需要 调查 缓冲 池 的 设置 是 否 有 效 。 这 个 命中 率 是 从 整体 来 看 的 ， 影 
啊 的 因素 很 多 ， 还 需要 进一步 分 析 是 本 地 绥 神 池 LBP 设置 过 小 ， 还 是 组 缓冲 池 GBP 效率 
比较 差 ， 又 或 者 是 不 同类 型 的 负载 冲突 。 

3. 本 地 缓冲 池 命 中 率 公式 

以 数据 页 的 访问 为 例 ， 数 据 本 地 缓冲 池 的 命中 率 如 下 所 未 : 
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数据 本 地 缓冲 池 的 命中 率 =(pool data lbp pages found - 
pool async data lbp pages Tound}y y pool data 1 reads + 
pool temp data 1 reads ) 
ER OO OO ke 


“> db2 “SELECT MEMBER, VARCHAR{(PpP name, 20)As bp name, 

> DEC((floatlpool data lbp pages Tound -— 
pool asyne data bp Pages foumnd jj float (pool data 1 reads + 
Boal temp Wata | Toaday)}™ I00, Dr 2 DATA LBP HLT 

> EROM TABRLE {MON GET BUEFEFERPOOBL' yy 2) where bp name not Jike “TRMSYSS 
and pool data 1 reads > 0U order by member,bp name" 


MEMBER BP NAME, DaTAa LBE HIT 
0 IBMDEFAULTBP bs es 
] IBMDEFAULTBP 91.24 


2 record(s) selected. 


er ee ee ee Le sane 生 eint 
据 的 计数 。 如 果 本 地 缓冲 池 命 中 率 低 ， 能 说 明 LBP 不 够 大 ， 也 有 可 能 是 因为 访问 的 是 
热点 数据 。 

索引 的 本 地 缓冲 池 命 中 率 与 此 相似 ， 替 换 公 式 中 的 data 为 index 即 可 : 


索引 本 地 缓冲 池 合 中 率 =( pool index lbp pages found - 
Pool asyne' ndex 1bp pages found / (Pocl ndex 1 Teads + 


Pal em ndexo Ureands) 


同样 通过 MON GET BUFFERPOOL 表 函 数 检 得 所 有 绥 神 池 在 所 有 节点 的 索引 页 本 地 
命中 率 ; 


~> db2 "SELECT MEMBER，VARCHAR (PP name, 20})AS bp name, 

> DEC{tIfloat (pool index lbp pages found — 
Pool Qsvyne ndex Ibp pages found }/ fioat (pool index 1 reads + 
BooLl emp nacz Teags 有 “ IO0 3. 2) TMDEX LBP HIT 
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> 上 ROM TABLE (MON GET BUFFERPOOL('';, -2)}) where bp name not like 'IBMSYSS" 


and pool data 1 reads > 0 order by member,bp name" 


MEMBER BP NAME, INDEX LBP HIT 
0 IBMDEFAULTBP 99.94 
1 IBMDEFAULTBP 14.29 


?27 record(s} selected. 
4. 组 缓冲 池 命 中 率 公式 
以 数据 页 的 访问 为 例 ， 数 据 组 绥 冲 池 的 命中 率 如 下 所 示 : 


数据 组 缓冲 池 的 命中 率 =( (pool data gbp 1 reads - pool data gbp p reads) - 
(POGL asvnc data gbp | reads = 和 oo asyne data gbp PP reads }} 1/ 


(Pool data 1 reads + pool temp data 1 reads ) 


下 面 这 个 例子 是 通过 MON GET BUFFERPOOL 表 函 数 检查 所 有 缓冲 池 在 所 有 


数据 组 缓冲 池 的 命中 率 : 


~> db2 "SELECT MEMBPR，VARCHAR(UBP name, 20)AS bp name, 


> DEC((float((pool data gbp 1 reads - pool data gbp p reads) 
(POOL asvne data gbp | Teads — Pool asyne data gbp pp reads ) 
floatlpool data 1 reads + pool temp data | reads})})™ 100, 5S, 二 | 
> FROM TABLE (MON GET BUFFERPOOL(' ; 2}) where bp name not like 'IBMSYSS'" 


and pool data 1 reads > U order by member,bp name" 


MEMBER BP NAME, DATA GBE HIT 
0 IBMDEFAULTBP 0.00 
1] IBMDEFAULTBP D0.09 


2 record(s) selected. 


索引 组 绥 剖 池 的 命中 率 与 此 相似 ， 蔡 换 公 式 中 的 data 为 index 即 可 : 


索引 组 缓冲 池 的 命中 率 =( (pool index gbp 1 reads - pool index gbp p reads) - 
[Pool asyne 1ndex gbp lireads — poopl async lngex gbp PP reads )}) / 


DATA GBP HIT 
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(Pool index 1 reads + pool temp index 1 reads ) 


同样 通过 MON GET BUFFERPOOL 表明 数 检 栓 所 有 绥 名 池 在 所 有 节点 的 索引 页 组 绥 
冲 池 的 命中 率 : 


~> db2 SELECTI MEMBER, VARCHAR {bp name, 20}AS bp name, 
> DEC{(float((pool index gbp 1 reads — Pool index gbp p reads) = 

(Deol asyne noex gbp | reads — pool asyne ndex ob Bp reads })/ 

rlioat (pool index 1 readstr poo]l temp index | reads}})* 100; 5, 2}) INDEX GBP HIT 
> FROM TABLE (MON GET BUFFERPOOL('', -2)) where bp name not like "IBMSYSS 当 ， 


and pool data 1 reads > 0 order by member,bp name" 


MEMBER BP NAME, INDEX GBP HIT 
0 IBMDEFAULTBP 中 二 局 如 
] IBMDEFAULTBP 0 


2 record(s) selected. 


组 缓冲 池 的 命中 率 通 常会 很 低 。 这 并 不 会 说 明 性 能 很 差 而 需要 扩大 组 缓冲 池 。 因 为 影 
吗 事务 访问 数据 的 主要 参考 是 全 局 的 缓冲 池 命 中 率 。 如 果 想 要 知道 GBP 的 大 小 设置 是 否 足 
够 ， 可 以 监控 GBP 满 的 情况 。 如 果 GBP 设置 过 小 ， 经 常 出 现 GBP 满 ， 会 导致 事务 更 新 数 
据 的 时 候 ， 需 要 等 待 GBP 与 完 数 据 页 才 有 空间 。 通 过 MON GET BUFFERPOOL 表 函 数 
检查 num gbp fll 的 次 数 ， 并 且 和 commit sql stmts 参数 比较 : 


~> db2 "select 10000.0 * sum(mggb.num gbp ful1) / sum(commit sql] stmts) from 
table {mon get group bufferpool(-2)) as mggb, sysibmadm.snapdb" 


0.0000000 


1 record(s) selected. 
这 个 比例 如 果 比 较 遍 ， 那 么 真 的 再 要 扩大 GBP 的 设置 。 
10.3.4 ”查看 全 局 锁 性 能 
DB2 集群 内 部 有 全 局 锁 ， 也 就 古 锁 的 竞争 发 生 在 不 同 成 员 之 则 。 因 此 需要 监控 与 全 局 
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锁 管 理 相 关 的 锁 等 待 、 匀 超 时 、 钞 升级 等 相关 性 能 指标 。DB2 提供 了 多 个 表 函 数 ， 可 以 列 
出 全 局 锁 管 理 的 这 些 监控 元 素 。 这 里 使 用 其 中 一 个 表 图 数 MON GET PKG CACHE STMT 
来 示范 。 这 个 表 函 数 会 收集 当前 数据 库 的 PACKAGE CASH 里 面 的 信息 ， 返 回 一 张 表 ， 可 
以 被 SQL 语句 直接 调用 。 


~> db2 SELECT MEMBER, LOCK WAITS GLOBAL,LOCK WAIT TIME GLOBAL, 
LOCK TIMEOQUTS GLOBAL, LOCK ESCALS GLOBALDL, 
SUBSTR (stmt text ,50 as stmt text 

EROM TABLEMON GEY ERG CACHE SME YY “Dy QULG, MULE, 21 a3 .TF 

WHERE LOCK WAITS GLOBAL <> 0 

order by LOCK WAIT TIME GLOBAL desc" 


W Ww Vv 


MEMBER LOCK WAITS GLOBAL LOCK WAIT TIME GLOBAL LOCK TIMEOQUTS GLOBAL 
LOCK ESCALS GLOBAL SIMT TEXT 


1 1 811 0 
Selscil ~ ITOm tt sel sal 

] 2 319 0 
setect Trom t produet .nie 

1 1 343 0 
Dsetect tron tIsett stat where mrno Tike “0002% 

0 1 298 0 
Goce rom tba where ond DJ 

0 1 68 0 
0 SELECT ™ FROM EE prodact nto WHERE prd 70 ?2 

0 3 45 0 
0 SELECT tx stat; retl msg, ext data, Lx code FROM Vv 

1 2 39 0 
0 select * fromyv rnl where chnl seg no Jike 81601> 

1 1 28 0 
0 select * from t product info where prd 1id="'0360018 

1 1 21 0 
0 select * from tL chnl bank 

1 1 2 0 
Dsetect* from t merchant acct where mer nO lake 

] ] 26 0 
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0 select * from tL merchant acct where mer no 11kK& “0 


lL 1 26 0 
select™ From € Mrchmmanl otet viere Concracrt 10— + 

0 1 13 0 
0 SELECT + FROM tt ctrl bw WHERE contract 1d ~? AND 3 

0 1 12 0 
0 select * from E Dis DCcE Tmt def where (mer no =? 

0 1 ii 0 
0 SELECT para val FROM tt pu para WHERE para name ="U 

0 1 11 0 
0 SELECT COUNT (*) FROM tL task nst WHERE (task stat 

0 1 11 0 


VY SELECT ‘GisSEINneE mer no,. Ped 1d, COntEract dy Carr Cod 
0 1 11 0 
I SEBEGT * FROM LE merchantl acct WHERE (mer noyprd 1d 


18 record(s) selected. 


在 调用 MON GET PKG CACHE STMT 返回 的 众多 信息 中 ， 案 例 里 面 查 询 了 
LOCK WAITS GLOBAL LOCK WAIT TIME GLOBAL LOCK TIMEOUTS GLOBAL、 
LOCK ESCALS GLOBAL 等 与 全 局 锁 管 理 相 关 的 监控 元 素 。 

e LOCKE WAITS GLOBAL: 因为 锁 被 其 他 member 占用 而 等 每 的 次 数 。 次 数 越 多 ， 

说 明 并 有 友 性 受 影响 越 大 。 
e LOCK WAIT _ TIME GLOBAL: 等 竺 其 他 member 占用 的 锁 的 时 间 。 时 间 越 多 ， 
说 明 并 有 友 性 受 影 啊 越 大 。 

e LOCK TIMEOUTS GLOBAL: 因 为 等 竺 其 他 member 占用 的 锁 而 产生 的 超时 次 数 。 

事务 会 因此 失败 而 回 深 。 

e LOCK ESCALS GLOBAL: 全 局 锁 升 级 的 次 数 。 锁 升级 会 导致 并 发 性 严重 降低 。 

这 个 表 函 数 对 于 在 查询 当前 一 段 时 间 的 系统 性 能 问题 是 否 是 因为 全 局 锁 而 引起 非常 
有 效 。 因 为 Package Cache 的 大 小 是 有 限 的 ， 所 以 早 些 时 间 运 行 的 SQL 语句 可 能 已 经 被 挤 
出 这 个 内 存 块 , 就 不 会 被 这 个 表 函 数 返回 。 DB2 还 提供 了 其 他 一 些 针 对 不 同 对 象 的 表 函 数 ， 
也 能 反馈 这 些 全 局 锁 的 信息 , 例如 MON GET CONNECTION、MON GET WORKLOAD、 
MON GET UNIT OF WORK 等 。 

通过 上 面 这 个 监控 ， 可 以 了 解 到 当前 的 热点 语句 和 热点 数据 。 全 局 锁 是 member 之 间 
的 饥 ， 也 束 是 在 不 同 的 member 上 运行 的 应 用 需要 访问 同一 张 表 的 相同 page 内 的 数据 。 一 
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种 解决 方式 就 是 将 这 些 应 用 安排 到 同一 个 member 上 运行 ， 就 不 存在 member 间 竞 争 的 问 
题 。 这 种 方式 可 以 通过 设置 客户 机 偶 好 的 方式 进行 。 前 提 是 定位 到 是 哪些 应 用 有 神 突 ， 单 
个 member 的 系统 资源 是 否 足 以 运行 这 些 应 用 。 男 一 种 方式 是 在 应 用 的 事务 中 加 入 更 多 的 
commit。 提 区 越 频 品 ， 锁 灵 放 得 越 快 ， 从 而 降低 锁 冲 突 的 概率 。 

如 果 观 察 到 LOCK ESCALS GLOBAL 出 现 ， 那 么 可 能 是 因为 cf lock sz 数据 库 参数 
设置 过 小 引起 的 ， 可 以 考虑 增 大 cf lock sz 数据 库 参数 。 


10.3.5 ”查看 页 回收 (page Reclaiming) 行 为 


DB2 集群 的 页 回收 行为 是 为 了 解决 不 同 成 员 并 发 访问 相同 数据 页 的 问题 。 虽然 避免 了 
完全 串 行 ， 但 是 这 种 行为 还 是 开销 比较 大 ， 人 性 能 不 理想 。DB2 提供 了 
MON _ GET PAGE ACCESS _JINFO 表 函 数 来 提取 相关 的 信息 。 这 里 宕 要 关心 的 是 什么 表 经 
前 发 生 这 样 的 行为 ， 这 种 行为 消耗 了 多 少时 间 ， 这 种 行为 发 生 在 哪个 数据 库 成 员 上 。 


~> db2 "SELECT SUBSTR (TABSCHEMA,1,8) AS TABSCHEMA, 

SUBSTR (TABNAME, 1,20) AS TABNAME, 
RECLAIM WAIT TIME， 
MEMBER, 
SUBSTR (OBJTYPE, 1,10) AS OBJTYPE 

FROM TABLE (MON GET PAGE ACCESS INFO (NULL,NULL,—2)) 

WHERE RECLAIM WAIT TIME > 0 

ORDER BY RECLAIM WAIT TIME DESC 

FETCH FIRST 10 ROWS ONLY" 


TABSCHEMA TABNAME, RECLAIM WALIT TIME, MEMBER OBJTYPE 
SYSITBM STSOCOLUMNS 162 0 TABLE 
STSLBM STSTABLES 44 0 TABLE 
SYSIBM SYTSCOLUMNS 20 0 TNDEX 
SISTLBM STSTABLES 11 0 TNDEX 
UNPSAPP H JRNL 6 0 TNDEX 
UNPSAPEPF I JRNL 1 0 TNDEX 
UNPSAPPF H JRNL 1 0 TNDEX 
UNPSAPP H JRNL 1 0 TNDEX 
SSTBM STSBUFFERPOOLS 1 0 TNDEX 
SSTBM STSPLAN 1 0 TABLE 
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10 record(s) selected. 


上 面 的 这 个 方法 可 以 找 出 因数 据 页 回收 而 消耗 时 间 最 多 的 表 .RECLAIM WAIT _TIME 
返回 等 待 的 时 间 ， 单 位 是 毫秒 。 

Page Reclaiming 其 实 还 是 全 局 锁 的 问题 .解决 的 思路 和 前 述 解决 全 局 锁 的 问题 差不多 。 
对 Page Reclaiming 的 监控 能 够 更 直观 地 发 现时 间 消 耗 了 多 少 , 从 而 定位 系统 的 性 能 问题 在 
多 大 程度 上 与 此 相关 。 


10.4 DB2 集群 设计 调 优 


DB2 集群 与 捍 机 版 相 比 最 大 的 开销 就 古 不同 成 员 之 间 的 事务 存在 苋 争 。 也 就 古 说 ， 执 
点 数据 的 处 理 问 题 在 DB2 集群 环境 中 放 的 很 大 。 基 本 上 DB2 集群 的 调 优 手 段 都 是 围绕 帮 
如 何 打 散 热点 数据 页 来 进行 的 。 


10.4.1 使 用 小 的 pagesize 


DB2 集群 推荐 使 用 pagesize 小 的 表 空 间 。 尤 其 是 热点 表 ， 如 果 人 查询 、 更 新 、 插 入 操作 
比较 多 ， 就 会 在 成 员 之 间 产 生 竞 争 。 小 一 点 的 pagesize 使 一 个 页 面 放 入 的 数据 少 ， 产 生 竞 


10.4.2 ”使 用 大 的 extentsize 


表 空 间 使 用 了 小 的 pagesize， 为 了 提高 预 取 的 效率 ， 最 好 使 用 大 的 extentsize。 尤 其 是 
在 有 大 量 插入 的 场景 中 ， 能 够 观察 到 使 用 大 的 extentsize 效果 更 好 。 


10.4.3 使 用 LOB inline 方法 


DB2 数据 库 提供 了 LOB inline 方式 来 存放 大 对 象 DB2 默认 大 对 象 是 和 行 数据 分 开 存 
放 的 。 大 对 象 的 谈 取 和 写 入 也 不 走 缓冲 池 , 在 数据 库 内 部 记录 为 DirectRead 和 DirectWrite。 
但 是 有 很 多 大 对 和 象 数据 其 实 并 不 是 很 大 ， 完 全 可 以 放 在 一 个 页 面 内 ， 和 行 数据 放 在 一 起 。 
这 样 谈 写 性 能 高 ， 同 时 还 能 被 压缩 。LOB inline 方式 就是 为 表 定 义 一 个 INLINE LENGTH,， 
所 有 小 于 这 个 值 的 大 对 象 都 和 数据 存放 在 一 起 。 

对 于 数据 库 集 群 ，LOB inline 方式 意味 看 更 大 的 行 记 录 ， 单 个 页 面 存 放 更 少 的 行 ， 减 
少 了 竞争 概率 。 
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10.4.4 使 用 大 的 pctfree 设置 


DB2 的 表 和 索引 都 可 以 设置 pctfree， 这 个 值 是 白 分 比 ， 意 思 是 在 一 个 页 面 内 部 预 留 多 
少 空间 。 这 个 参数 在 load 和 reorg 的 时 候 才 生效 ， 对 正 利 的 插入 是 没有 作用 的 。 所 以 通 币 
情况 下 并 不 建议 修改 。 同 时 设置 更 大 的 pctffee， 意 味 着 需要 更 多 的 页 来 装 数 ， 也 就 是 空 
则 占用 高 。 所 以 这 个 方法 的 适用 场景 要 限制 好 : 

e 小 表 : 小 表 的 空间 占用 少 ， 即 便 设 置 大 的 pctfree， 也 不 会 导致 实 间 紧张 。 

e 热 表 : 数据 得 询 更 新 很 多 ， 并 且 集 中 ， 需 要 分 散热 点 页 。 

e 插入 量 小 : 插入 数据 会 赛 满 pctfree 的 空间 ， 所 以 插入 量 大 的 表 并 不 适合 。 
10.4.5 ”了 巧 用 CURRENT MEMBER 


DB2 在 多 节点 环 培 中 提供 了 CURRENT MEMBER 变量 ， 若 应 用 连接 在 成 员 0 节点 ， 
那么 获取 的 这 个 CURRENT MEMBER 变量 就 是 0。 


AGDPCMBIT :ychogm db2arc/kzhsdb2 ”walues current member™ 


recordl(s) selected. 


如 果 为 表 加 入 一 列 并 插入 CURRENT MEMBER 的 值 ， 那 么 不 同 成 员 插 入 的 值 就 不 一 
样 。 首 先 ，CURRENT MEMBER 的 用 处 是 解决 热点 索引 页 。 

这 里 讨论 两 种 不 同类 型 的 标 引 。 一 种 索引 是 插入 频 霉 的、 顺序 增长 的 数字 ， 例 如 目 增 
列 、 订 列 号 、 时 间 惟 等 。 因 为 退 加 的 行 都 沙 在 索引 的 最 后 几 页 ， 会 导致 热点 页 问 题 。 通 过 
加 入 CURRENT MEMBER 到 索引 里 ， 每 个 成 员 插 入 的 索引 会 在 不 同 的 页 里 。 示 例如 下 : 


alter table orders add column curmem smallint default current member 
impPlicitly hidqden; 


create index seqindex on ordernumber (curmem, seqnumber).; 


orders 表 有 个 顺序 增长 的 seqnumber 列 ， 加 入 curmen 之 后 ， 不 同 成 员 插 入 的 curmem 
不 同 ， 对 应 的 索引 页 也 不 同 ， 因 此 解雇 了 热点 索引 页 问题 。 

男 一 种 索引 类 型 是 索引 取 值 比较 少 ， 每 次 插入 新 的 数据 部 是 在 原 有 的 守 引 值 上 插入 新 
的 RID， 导 致 这 些 值 对 应 的 索引 页 成 为 热点 。 例 如 省 份 、 邮 编 这 样 的 列 。 这 种 情况 下 ， 可 
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以 把 CURRENT MEMBER 加 到 索引 的 后 面 ， 也 可 以 促使 不 同 成 员 插 入 的 数据 落 在 不 同 的 
索引 页 面 里 。 示 例如 下 : 


alter table customer add column curmem smallint default current member 
implicitly hidden; 


create index stateidx on customer (state, curmem); 


10.4.6 ” 巧 用 随机 索引 


随机 索引 是 DB2 为 了 解决 热点 页 问题 提供 的 独 功 能 。DB2 的 索引 一 般 和 者 是 升序 或 降 
序 排 列 。DB2 从 V10 开始 提供 了 随机 索引 。 俩 蛙 来 说 ， 随 机 款 引 束 古 将 索引 的 列 值 按照 蛤 
市 算 法 分 袋 ， 然 后 对 同 梓 的 哈 硕 值 页 面 进行 再 排序 。 所 以 随机 票 引 对 于 按照 值 定 问 得 询 是 
很 快 的 ， 但 是 对 于 范围 取 值 的 效率 会 低 于 种 规 索 引 。 

不 例如 下 : 


CREATE TABLE "DBZ2ZPURE™."SMS CODE™ ( 
“SC TASKID™” VARCHAR(32 OCTETS) NOT NULL ， 
“SC MOBILE®™ VARCHAR(20 OCTETS) ， 
"SC CODE™ VARCHAR (40 OCTETS) ， 
"SC COUNT™ INTEGER ， 
“SC CREATETIME” TIMESTAMP ， 
"SC EXPIREDTIME"” TIMESTAMP) 
ORGANITZAE BY ROW; 


CREATE UNIQUE INDEX “DB2PURE - ”SC CREATETIME"” ON "DBZ2PURE™"."SMS CODE" 
("SC CREATETIME™ RANDOM) 
TINCLUDE NULL KEYS ALLOW REVERSE SCANS; 


上 面 介绍 了 在 DB2 集群 里 一 些 常用 的 调 优 方法 , 中 心思 想 就 是 通过 数据 库 内 部 的 技术 
手段 打 散 热点 数据 页 ， 减 少 成 员 之 间 的 竞争 。 事 实 上 从 上 层 应 用 角度 考虑 ， 通 过 区 分 不 同 
的 工作 负载 ， 指 定 有 竞争 关系 的 负载 运行 在 相同 的 成 员 节点 上 ， 也 可 以 避免 成 员 之 间 的 况 
和 争 。 当 然 这 各 方式 与 应 用 设计 的 关系 比较 密切 ， 需 要 因地制宜 。 


10.5 ”同城 双 活 集群 介绍 


DB2 集群 采用 的 是 共享 存储 的 方式 ， 所 以 通 凋 DB2 pureScale 集群 都 是 架 建 在 同一 地 
理 位 置 。 但 是 这 种 情况 下 ，DB2 pureScale 集群 部 署 在 同一 站 上 点， 如果 这 个 站 点 整体 发 生 故 
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障 ， 数 据 库 集群 将 不 可 用 。 

针对 这 种 站 点 级 别 高 可 用 的 需求 ,DB2 提供 了 一 种 特殊 的 地 理 上 分 敌 的 DB2 pureScale 
集群 架构 解决 方案 ， 也 就 是 GDPC。 所 以 GDPC 只 是 搭建 DB2 pureScale 集群 的 一 种 方式 ， 
逻辑 上 还 是 一 套 pureScale 集群 , 但 是 物理 上 分 散在 不 同 地 理 位 置 。 这样 即使 其 中 一 个 站 点 
整体 故障 ，DB2 pureScale 集群 也 只 会 损失 一 半 的 和 节点， 还 有 一 半 的 节点 存活 ， 仍 然 可 以 提 
供 数据 库 服务 。 

下 面 通过 图 10-6 来 了 解 GDPC 同城 双 活 集群 的 架构 : 


Dark Fiber or Wan 


站 点 之 间 的 分 区 SAN 访问 权 


用 于 在 交点 之 则 进行 复制 的 GPFS 共享 存 博 釉 


图 注 


国 范围 扩展 器 
一 商 巡 网 络 


| 一 以 本 网 


| 一 光 计 主 维 
| | 集群 互 连 


图 10-6 同城 双 活 集群 的 架构 
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如 上 图 所 示 ， 上 典型 的 GDPC 架构 是 三 站 点 的 方式 。 站 点 A 和 站 点 B 是 对 等 站 点 ， 真 
正 提供 数据 库 服务 。 站 点 C 是 仲裁 站 点 ， 当 站 点 A 和 站 点 B 之 间 网 络 出 现 问 题 的 时 候 ， 
也 就 是 有 可 能 出 现 所 谓 的 脑 裂 的 情况 下 ， 谁 抢 到 了 站 点 C， 谁 束 是 存活 的 站 点 。 这 样 的 仲 
裁 方 法 可 以 避免 脑 裂 的 发 生 。 

站 点 A 和 站 点 也 都 需要 具备 独立 存活 的 能 力 。 所 有 集群 里 的 两 个 CF 会 分 布 在 这 两 个 
站 点 上 ， 集 群 里 的 所 有 member 必须 是 双 数 ， 同 时 必须 对 半分 布 在 这 两 个 站 点 上 。 每 个 站 
点 都 有 目 己 的 本 地 存储 ， 两 个 站 点 间 存 储 需 要 进行 实时 同步 复制 。 这 样 即便 一 个 站 点 出 
现 问题 ， 另 外 一 个 站 点 的 存储 还 是 能 够 一 样 使 用 。 所 以 这 两 个 站 点 几乎 可 以 称 为 是 完全 对 
称 的 。 

站 点 C 作为 仲裁 站 点 ， 平 时 是 不 工作 的 ， 所 以 没有 特殊 的 性 能 需求 。 它 只 会 在 出 现 需 
要 作 仲 裁 的 时 候 起 作用 。 站 点 C 也 需要 设置 本 地 存储 ， 加 入 到 GPFS 集群 里 面 ， 作 为 仲裁 
熏 ， 不 需要 放置 任何 数据 ， 所 以 对 性 能 也 没有 要 求 。 

站 点 A 和 站 点 也 之 间 需 要 使 用 RDMA 协议 通信 , 还 需要 存储 复制 .这 些 功能 都 由 DB2 
pureScale 来 实现 ， 但 是 也 需要 硬件 的 支持 。 所 以 站 点 A、B 之 间 的 网 络 、 存 储 的 SAN 网 
络 需 要 相通 。 这 是 相对 于 传统 pureScale 本 地 集群 ， 实 现 GDPC 代价 比较 高 的 地 方 。A、B 
站 点 的 距离 和 网 络 带宽 ， 会 直接 影响 到 数据 库 的 性 能 。 这 也 是 GDPC 环境 最 需要 关注 的 
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DB2 GDPC 同城 双 活 集群 相对 于 同 机 房 的 DB2 pureScale 集群 ， 最 大 的 不 同 是 存储 需 
要 通过 GPFS 在 双 中 心 同 步 复制 ， 成 员 节 点 需要 路 站 点 与 CF 节点 通信 。 相 差 70 公里 的 两 
个 和 节点， 网络 ping 的 延 时 是 0.8 旺 秒 ; 而 通过 GPFS 复制 ， 写 入 文件 系统 的 IO 啊 应 时 间 是 
4 昌 秒 。 这 和 同 机 房 的 DB2 集群 相 比 是 非常 大 的 。 所 以 在 DB2 集群 中 容易 碰 到 的 性 能 问 
题 在 双 活 环境 中 更 加 明显 。 

下 面 从 存储 和 通信 两 个 方面 介绍 如 何在 DB2 GDPC 同城 双 活 环境 中 调 优 。 


10.6.1 减少 存储 影响 


DB2 GDPC 集群 访问 内 部 GPFS 文件 系统 ， 读 是 从 本 地 存储 读 取 ， 写 是 双 写 ， 壳 要 等 
到 双 中 心 存储 都 返回 成 功 才气 完 成。 所 以 对 存储 的 调 优 主要 是 在 写 这 方面 。DB2 需要 与 的 
文件 主要 是 数据 文件 、 日 志文 件 和 诊断 文件 。 

对 于 数据 文件 ， 最 不 希望 看 到 的 是 同步 写 盘 。 上 所 以 需要 设置 较 大 的 本 地 缓冲 池 和 组 绥 
冲 池 ， 同 时 调整 page age tret mcr 和 page age tret gcr 参数 。 
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对 于 日 志文 件 ， 数 据 库 的 日 志 是 先 写 入 日 志 绥 冲 区 ， 然 后 在 提交 的 时 候 写 入 磁盘 。 所 
以 设置 较 大 的 日 志 绥 冲 区 ， 能 够 缓冲 更 多 的 日 志 ， 提 交 的 时 候 一 次 写 入 更 大 的 IO 到 磁盘 。 
这 个 缓冲 区 够 用 就 好 ， 不 要 出 现 日 志 缓冲 区 满 的 情况 就 可 以 。 

对 于 诊断 文件 ， 例 如 db2dump 对 应 的 目录 ， 不 要 放 在 GPFS 文件 系统 里 ， 而 是 在 本 地 
磁盘 上 建立 单独 的 文件 夹 来 存放 。 


10.6.2 减少 通信 影响 

DB2 集群 内 部 的 通信 主要 是 缓冲 池 页 面 的 注册 、 存 放 和 锁 资源 的 申请 。 减少 通信 的 影 
啊 就 是 从 这 些 方面 着 手 ， 减 少 通信 开销 ， 尤 其 是 跨 站 点 成 员 与 CF 的 通信 。 

1. 避免 全 表 扫 描 

全 表 扫 描 会 对 扫 摘 的 所 有 页 面向 CF 节点 注册 组 绥 冲 池 ， 访 问 的 数据 量 越 大 ， 这 种 通 
信 开 销 就 越 大 。 所 以 要 创建 合适 的 索引 ， 减 少 注册 组 绥 冲 池 的 成 本 。 

2. 就近 跑 批 

批 处 理 一 般 会 处 理 大 量 数据 ， 不 可 避免 地 与 CF 通信 。 在 DB2 pureScale 集群 内 部 ， 主 
CF 节点 和 备 CF 节点 并 非 完 全 一 致 ， 只 有 必要 的 数据 才 会 一 致 。 所 以 在 观察 CF 资源 使 用 
的 时 候 ， 主 CF 节点 的 CPU 真实 使 用 率 会 高 一 些 。 也 就 是 说 ， 成 员 节 点 和 主 CF 的 通信 内 
容 更 多 。 批 处 理 一 定 要 放 在 和 主 CF 同 机 房 的 成 员 节 点 上 。 


3. 就 近 runstats 


收集 统计 信息 需要 扫描 表 ， 这 对 于 成 员 和 CF 的 通信 也 是 比较 大 的 压力 。 所 以 请 把 手 
动 runstats 工作 放 在 和 主 CF 同 机 房 的 成 员 节 点 上 。 自 动 mnstats 也 是 可 控 的 , 在 DB2 集群 
内 部 ， 第 一 个 局 动 的 成 员 会 承担 这 些 管理 工作 ， 也 就 是 说 ， 目 动 runstats 会 运行 在 这 个 节 
点 上 。 所 以 在 集群 启动 时 ， 先 启动 和 主 CF 同 机 房 的 成 员 节 点 。 

4. 就 近 访 问 成 员 节 点 

应 用 服务 器 通过 DB2 客户 端 程序 或 驱动 访问 集群 内 部 的 成 员 ， 要 避免 路 站 点 访问 。 所 
以 建议 采用 客户 病人 和 偏 好 的 方式 ， 指 定 同 机 房 应 用 服务 器 访问 本 机 房 成 员 节 点 。 
10.6.3 ” 热 总 表 调 优 案 例 


热点 数据 访问 的 效率 问题 在 DB2 GDPC 同城 双 活 环境 中 反映 更 明显 。 国内 某 金 融 行 业 
公司 在 部 署 GDPC 同城 双 活 集群 的 时 候 就 过 到 了 非常 膝 烦 的 热点 表 性 能 问题 。 这 种 表 的 用 
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法 很 冲 见 ， 融 是 流水 表 ， 存 在 大 量 的 并 发 插入 。 与 此 同时 ， 该 表 还 存在 对 插入 数据 的 查询 
和 更 新 。 


CREATE TABLE “CHGMDB “."SERVICE Loe ( 
"ID™” INTEGER NOT NULL ， 
"CLIENT SERIAL NUMBER™ CHAR(32 DCIEIS NOT NULL ， 
"CREATE TIMESTAMP” TIMESTAMP ， 


"REQUEST MESSAGE™ CLOB(10483 6 OCTETS) INLINE LENGTH 3010 
NOT LOGGED NOT COMPACT ， 
"RESPONSE MESSAGE ”CDLOB (LU04852 16 OCTETS) INLINE LENGTH 3010 
NOT LOGGED NOT COMPACT 
ORGANITZAE BY ROW; 
CREATE UNIQUE INDEX “CHGMDB “- SERVICE LOG CLIENT SERIAL NUMBPR ”ON 
“CHGMDB ™."SERVICE LOG" 
( CLIENT SERIAL NUMBER ”ASC) 
TINCLUDE NULL KEYS ALLOW REVERSE SCANS; 


CREATE INDEX "CHGMDB “- SERVICE LOG CREATE TIMESTAMP™” ON "CHGMDB 
”- “SERVICE LOG" 
("CREATE TIMESTAMP™” ASC) 
TNCLUDE NULL KEYS ALLOW REVERSE SCANS; 


CREATE INDEX “CHGMDB “- SERVICE Loe ID ”ON “CHGMDB ™."SERVICE LOG" 
(“FD™ RoC 
TINCLUDE NULL KEYS ALLOW REVERSE SCANS; 


在 没有 调 优 之 前 , 并 发 插入 的 性 能 非 第 差 ,通过 db2pd -latches 发 现 很 多 的 latch 等 符 。 


征 。 这 个 表 里 的 ID 列 是 插入 的 序列 ，CLIENT SERIAL NUMBER 列 是 唯一 值 ， 
SERVICE LOG _ CREATE TIMESTAMP 也 是 最 怕 遇 到 的 热点 索引 类 型 。 

最 初 对 这 张 表 的 调 优 就 是 加 入 了 CURRENT MEMBER 列 和 将 CURRENT MEMBER 运 
用 到 这 三 个 索引 里 面 ， 也 就 是 把 CURRENT MEMBER 放 在 索引 的 第 一 列 。 但 是 这 种 方式 
适用 的 是 纯 插 入 场景 ， 对 于 插入 的 数据 还 要 得 询 和 更 新 ， 效 果 束 打折 扣 了 了。 调整 之 后 ， 人 性 
能 有 一 定 提升 ， 但 是 离 预 期 的 目标 相差 还 很 远 。 同 时 CURRENT MEMBER 在 索引 中 的 加 
入 也 会 导致 不 能 保证 索引 的 唯一 性 。 

最 后 使 出 了 组 合 拳 : 
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CREATE TABLE “CHGMDB “."SERVICE LOG™” I 
“ID™ INTEGER NOT NULL ， 


“CLIENT SERIAL NUMBER™ CHAR(32 OCTETS)} NOT NULL ， 
"CREATE TIMESTAMP” TIMESTAMP ， 


“REQUEST MESSAGE™” CLOB(10483/6 OCTETS) INLINE LENGTH 3010 
NOT LOGGED NOT COMPACT 


Fr 


"RESPONSE MESSAGE™ CLOB(10482 /6 OCTETS) INLINE LENGTH 3010 
NOT LOGGED NOT COMPACT 


Fr 


"CURMEM" SMALLINT IMPLICITLY HIDDEN WITH DEFAULT CURRENT 
NODE ,， 


"IDKEY™” SMALLINT IMPLICITLY HIDDEN GENERATED ALWAYS AS 
(MOD (ID,10) + MOD (CURMEM,4)*10) ) 
PARTITION BY RANGE (IDKEY) 


(STARTING FROM 0 ENDING AT 39 EVERY 1) 
ORGANIZE BY ROW; 


CREATE UNIQUE INDEX “CHGMDB ™."SERVICE LOG CLIENT SERIAL NUMBER ON 
"CHGMDB “- “SERVICE LOG™ 
("CLIENT SERIAL NUMBER ”RANDOMI) 
INCLUDE NULL KEYS ALLOW REVERSE SCANS,; 


CREATE INDEX "CHGMDB “- SERVICE LOG CREATE TIMESTAMP” ON “CHGMDB 
”SERVICE LOG" 


("CREATE TIMESTAMP™” ASC) 
PARTITIONED 
TINCLUDE NULL KEYS ALLOW REVERSE SCANS; 


CREATE INDEX "CHGMDB “."SERVICE LOG ID” ON "CHGMDB “- SERVICE LOG" 
TD RoC} 
PARTITIONED 
INCLUDE NULL KEYS ALLOW REVERSE SCANS ， 


其 中 CURMEM 是 基于 CURRENT MEMBER 的 自生 成 列 ， 在 4 成 员 节 点 的 集群 里 取 
值 是 0 到 3。IDKEY 是 基于 序列 ID 和 自生 成 列 CURMEM 计算 出 来 的 自生 成 列 。 方 法 是 
用 ID 序列 对 10 求 余数 , 结果 是 0 到 9, 加 上 CURMEM 乘 10, 最 终 IDKEY 的 取 值 是 0-39 
循环 。 成 员 0 上 生成 的 IDKEY 是 0-9 循环 ， 成 员 1 上 是 10-19 循环 ， 成 员 2 上 是 20-29 笛 
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环 ， 成 员 3 上 是 30-39 循环 。 这 种 巧妙 的 设计 ， 使 得 不 同 成 员 生 成 的 数据 落 在 各 目 独 立 的 
分 区 内 部 ， 同 时 在 同一 成 员 内 部 ， 相 近 的 数据 也 循环 沙 在 不 同 的 分 区 内 。 这 样 热点 数据 就 
被 彻底 打 藤 了 。 对 于 索引 ， 需 要 保证 唯一 性 的 CLIENT SERIAL NUMBER 列 采 用 了 
RANDOM 系 引 ， 另 外 两 个 索引 直接 使 用 分 区 索引 。 节 终 调 优 效果 非 和 营 明 显 。 


10.7 “本章 小 结 


进行 DB2 集群 环境 性 能 调 优 需 要 对 DB2 集群 的 内 部 机 制 非常 了 解 ， 在 此 基础 上 还 要 
经 过 一 次 次 的 答 试 和 验证 。 如 同 其 他 调 优 ， 这 是 一 个 循序 渐进 、 衢 环 处 理 的 过 程 。 通 过 对 
监控 指标 的 和 掌握， 了解 相应 的 性 能 租 贷 ， 骨 基于 这 些 优化 手段 逐步 尝试 ， 最 终 可 以 达到 一 
个 好 的 效果 。 


优 案 例 、 问 题 总 结 和 技巧 


在 本 章 ， 我 们 主要 给 大 家 举 一 些 案例 ， 希 望 大 家 能 够 通过 对 这 些 
调 优 有 更 深入 的 认识 。 这 些 案例 都 是 来 自 于 国内 的 某 些 真实 案例 ， 具 
本 章 主要 包括 如 下 内 容 : 
e 菏 移 动 公司 存 储 设计 不 当 和 SQL 引起 的 IO 瓶颈 
某 银 行 知 识 库 系统 锁 等 每 、 锁 升级 引起 性 能 憩 颁 
某 汽车 制造 商 ERP 系统 通过 调整 统计 信息 提高 性 能 
菜农 信 社 批量 代 收 电费 批 处 理 慢 调 优 案例 
某 银行 系统 系统 SQL 执行 慢 ， 通 过 track 信息 获取 调整 信息 
某 银 行 系统 字段 类 型 定义 错误 导致 SQL 执行 时 间 变 长 
某 银 行 客户 回 单 系统 CPU 使 用 率 高 
东 银 行 手机 银行 系统 latch 葛 争 导致 active session 局 、 性 能 慢 问 题 
利用 压力 测试 程序 学 习 DB2 性 能 调 优 


11.1 调 优 案例 1: 某 移动 公司 存储 设计 不 当 和 SQL 引起 
的 I/O 瓶颈 


1. 委 例 简介 


菜 移动 通信 公司 经 营 分 析 系 统 是 一 个 大 型 的 复杂 系统 。 在 这 个 系统 中 ， 从 上 全 下 包括 


案例 的 学 习 ， 对 性 能 
有 很 高 的 参考 价值 。 
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以 下 几 个 层次 : 应 用 程序 、 数 据 库 、 主 机 系统 (操作 系统 )、SAN 网 络 和 ESS 存储 系统 。 在 
发 生 系统 的 性 能 问题 时 ， 性 能 问题 的 定位 和 调 优 就 会 很 复杂 。 


2. 问题 描述 


该 移动 通信 公司 经 营 分 析 系 统 从 年 初 开 始 陆续 上 上线， 经 营 分 析 系 统 在 上 线 运行 一 段 时 
间 后 出 现 性 能 问题 ， 主 要 表现 在 对 最 终 用 户 的 交互 啊 应 不 如 预期 ， 尤 其 在 业务 繁忙 时 更 是 
无 法 得 到 及 时 的 交互 响应 。 从 主机 系统 上 观察 ， 主 要 表现 在 系统 的 IO 等 待 较 大 。 经 营 分 
析 系 统 是 由 业务 应 用 程序 、DB2 数据 库 、AIX 主机 、ESS 存储 多 个 部 分 组 成 的 ， 因 此 性 能 
瓶颈 的 定位 和 性 能 的 优化 都 比较 复杂 。 


3. 性 能 优化 步 又 


(1) 建立 性 能 调整 目标 : 响应 时 间 能 够 满足 客户 和 要求。 

(2) 检查 经 营 分 析 系 统 中 所 有 人 硬件 系统 ， 特 别 是 SAN 网 络 中 的 硬件 。 

(3) 检查 SAN 交换 机 的 数据 流量 ， 观 察 是 否 有 通道 流量 不 对 称 、 数 据 包 丢 失 或 数据 传 
输 过 程 中 校 验 错 的 问题 。 

(4) 分 析 ESS 上 的 数据 分 布 , 利用 相关 存储 监测 软件 , 观察 是 否 存在 FC 通道 、cluster、 
SSA 卡 或 SSA loop 负载 不 平均 的 现象 。 

(5) 检查 并 优化 主机 系统 上 AIX 运行 的 参数 ， 使 之 适合 经 营 分 析 系 统 的 运行 。 

(6) 监控 数据 库 运 行 ， 检 查 DB2 数据 库 的 参数 设置 是 否 合 理 。 

(7) 确定 最 影响 性 能 的 应 用 程序 ， 协 助 软件 开发 商 优化 应 用 程序 。 


4. 性 能 问题 的 定位 、 优 化 措施 和 建议 

1) 主机 和 存储 系统 I/O 优化 。 

e 优化 前 后 IO 资源 的 使 用 状况 。 

e AIX 主机 系统 观察 到 的 LO 资源 的 使 用 情况 。 

以 下 是 2 月 26 日 在 SYSTEMyz2 主机 系统 上 运行 vmstat 得 到 的 结果 : 


kKE hr memory page faults cpu 

rbp aVIm fre FT LL Be Sr Tn a cs us sy ld wa 
1. 0 3 31905 ZHU 1 39302 T1719] 20 h 2 | 
村 二 1d321744 216119 位 0 9 059 019 6211 18 HH 2 15 
2 0 44 1432881] 216038 0 0 0 0 0 0 4414 8652 2838 16 6 1 了/ 
2 0 41 i433126 2Z15L83 0 1 3998 S398L1 wll 16 53 | 8 
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0 3 1432986 21992F 0 VU 0 432 T3580 86190 2L 6 2 Tl 
2 1 44 T1433039 20822512 1 0 0 总 186 T0533 644 7 日 1 6 
3 0 39 1433173 2 0 0 0 0 0 533019 ll228 722 22 & 1 7l1 
20 34 1433867 2150130 4 1 0 0 0 3847 18i132 4562 14 6 4 i6 
2 32 T14373357 ZFID9TT 0 9 053 08353 3237T7 3 如 这 [4 
20 33 lA431403 27746709 0 0 0 0 4184 1182 32433 19 FF 1 /3 
1 0 43 1431442 211428 0 0 0 0 0 0 4 9398FE 3360 14 3 2 19 
3 0 40 143406] 21714883 0 0 9 0 0 4 161053 693930 22 9 1 69 


cpu 一 列 中 的 wa(LO 等 待 ) 项 均 在 70% 以 上 ，kthr 列 中 的 p(pending) 项 (等 竺 物理 IO 操 
作 的 进程 数 ) 达 到 40 左右 ，DB2 数据 库 端 反映 对 存储 设备 的 操作 很 慢 。 以 上 数据 说 明 存在 
LO 方面 的 性 能 问题 。 


2) MO 问题 的 发 现 与 定位 
通过 如 下 步骤 对 AIX 主机 系统 和 整个 系统 系统 地 进行 检查 : 
e 便 件 系统 检查 ， 包 括 光 纤 通 道 卡 ， 光 纤 线 、SAN 交换 机 的 FC 通道 ， 以 及 ESS 的 
FC 通道 、 硬 盘 的 检查 。 最 终 排 除了 由 于 硬件 损坏 产生 的 性 能 影 啊 。 
e SAN 交换 机 检查 ,检查 分 析 SAN 交换 机 的 每 个 FC 端口 的 流量 。 相 应 端口 流入 和 
流出 的 数据 量 相等 ， 没 有 数据 包 丢 失 和 CRC 校 验 错 的 情况 ， 说 明 SAN 网 络 是 正 
常 的 。 
检查 ESS 的 数据 分 布 。 根 据 ESS 的 数据 分 布 图 ， 如 图 11-1 所 示 ， 可 以 看 出 整个 经 营 
分 析 系 统 有 4 台 主 机 ， 每 台 主 机 有 两 个 卷 组 。 而 所 有 8 个 卷 组 全 部 分 布 在 左边 clusterl 的 
DA3 和 DA4 两 块 SSA 卡 上 面 。 产 生 的 结果 是 所 有 的 IO 都 集中 在 clusterl 的 这 两 块 卡 的 4 
个 通道 上 ; 而 cluster2 以 及 其 他 的 SSA 卡 和 通道 处 于 空闲 状态 。 可 见 ，ESS 的 数据 分 布 存 
在 问题 。 通 过 分 析 ， 决 定 首先 应 该 调整 数据 在 ESS 上 的 分 布 。 


3) 调整 方案 

首先 将 数据 平均 地 分 布 在 两 个 cluster 上 ， 之 后 将 数据 分 布 在 尽 可 能 多 的 通道 上 。 

由 于 整个 数据 容量 有 约 2120GB， 整 个 数据 的 迁移 需要 几 十 个 小 时 的 时 间 ， 而 在 生产 
系统 上 是 不 允许 有 很 长 的 停机 时 间 进 行 数 据 迁 移 的 。 

根据 多 个 方案 的 论证 对 比 , 决定 采用 迪 辑 郑 锐 像 的 方案 实施 数据 迁移 。 具 体 的 步 又 是 : 
先 将 所 有 的 逻辑 卷 在 目的 人 硬盘 上 建立 镜像 、 同 步 数 据 ， 册 将 原价 盘 上 的 锐 像 部 分 删除 。 整 
个 数据 迁移 工作 全 部 在 系统 的 后 台 进 行 ， 共 进行 了 60 个 小 时 , 才 完 成 所 有 数据 迁移 。 完 成 
两 次 数据 迁移 后 的 数据 分 布 如 图 11-2 所 示 。 
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FSS-800(1) 


All Raidl10 with LUN 
Size=70. 16B, Total=128 x 70. 1GB=89 
(12. 8GB 


Clusterl Cluster? 


Mrrays ATTaV5 


yzvgl2 
|_| Yzvgl3 
国 Yzvgl4 


图 11-1 数据 分 布 调整 前 的 ESS 数据 分 布 图 
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ESS-800 (1) 
All Raidl0 with LUN 
Size=70. 1GB, Total=128 X70. 1GB=89 
72. 8GB 


Clusterl Cluster2 


DAl 


DAl ATTaY2 ArTay4 ATrTray6 


Arrayl1 Arrayd ArTrayo 


上 yzvgll 
yzvel2 


| | yzvg31 
转 yzvg32 DA2 


图 11-2 ”数据 分 布 调整 后 的 ESS 数据 分 布 图 


4) I/O 的 调 优 结果 
本 次 数据 迁移 的 效果 非常 明显 。 


以 下 是 3 月 10 日 第 二 次 数据 分 布 调整 后 ， 在 SYSTEMyzl 主机 系统 上 运行 vmstat 得 


到 的 输出 结 来 : 
kthr memory page faults cpu 
rbp avm fre Ti Tol Bo fr Sr TN sy CS Ss oY 19 
40 16 1090229 2344637 0 120 0 0 0 31T86 Zi2n9 2037 48 3 9 
4 1 15 1090005 2344860 0 ll10 0 0 0 S30835 3338 9 37 4 1 
30 16 1090636 2944227 0 100 0 0 0 二 
oe 0 12 1089367 29454932 0 8 0 0 0 0 3324 BIAL OEY 38 7 22 
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30 16 1090008 2344851 0 100 0 0 0 3608 3297 1921 40 4 7 #48 
1 LION :204483L BLO 0 3 3320 13727 3 二 31 
nL 29043490 0 T2000 本村 303 23 T6733 3 2 39 
30 lI ID0S00l3 944848 0 BB 0 9 9 S65 932 3 村 ZZ0 33 
0 1 T0933 2943346 0 T2200 © 9 33368 S02 124 393 名 13 40 
0 1 1I0930653 2944201 0 8 0 9 8 3184 11124 21893 51 8 3 38 


IO 等 待 值 由 原来 的 70% 以 上 下 降 到 了 30% 左 右 ， 个 别 时 间 其 至 隆 至 10% 以 下 。 等 待 
物理 IO 操作 的 进程 数 由 40 多 个 下 降 到 了 十 几 个 。 但 是 这 仍然 存在 WO 等 每 。 这 个 时 候 我 
们 要 检查 数据 库 和 应 用 SQL 问题 。 


存储 调整 前 资源 的 使 用 状况 
图 11-3 所 示 是 3 月 19 日 SYSTEMyzl 主机 系统 的 IO 使 用 率 的 曲线 图 。 在 这 段 时 间 
内 ，CPU 的 使 用 率 基 本 上 保持 在 100%， 存 在 很 大 的 VO 等 待 。 


CPU Total bossvzl 


User% Sys% DWait® 


Time of 巴豆 了 


图 11-3 存储 调整 前 资源 的 使 用 情况 


存储 调整 后 资源 的 使 用 情况 
根据 上 面 的 调整 结果 ， 系 统 IO 的 状况 已 经 得 到 了 极 大 改善 ， 如 图 11-4 所 示 ， 系 统 的 


性 能 瓶颈 主要 存在 于 应 用 对 CPU 资源 的 消耗 。 


CPU Total bossyz4 


国 User% 国 Sys% 口 Wait 弗 


图 11-4 存储 资源 调整 前 资源 的 使 用 情况 
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5. 应 用 和 DB2 数据 库 的 性 能 分 析 和 建议 


利用 DB2 的 监控 工具 ， 检 查 系 统 的 配置 参数 和 应 用 SQL 语句 ， 发 现 系 统 中 最 消耗 资 
源 的 前 12 条 语句 ， 如 图 11-5 所 示 。 


» db2 "select (total_usr_cpu_timettotal_sys_cpu_time) as total_cpu_time,substr(stmt_text,1.,256) as stmt_text 
from table( SNAP_GET_DYN_SAL_VSIC'',-2)) as 8 order by total_cpu_time desc fetch first 12 rows only" 


TOTAL_C 
PU TIRE STMHT_TEXT 


SELECT 

INSERT , 

SELECT = ?了 WITH UR -~ OPTLEVYEL!( 5 ) 
SELECT “CONTRRCT_INT” , “CN_CHANGE_TSTAMP® ，”URLID_FROM”，”URLID_TO” ，”URLID_TO_RERL” ， ”CN_BEGSD 
3ELECT “CONTRACT_INT® , “AC_CHANGE_TSTAMP® , “UALID_FROM® , “UALID_TO® , “UALID_TO_RERAL” , “ACNUM_C 
3ELECT “CONTRACT_INT® , “TURNOUER_CLASS™® , “BALANCE® , “LCOLDATE™® , “LPQOSTDATE® , “LAST_REL_THSP® ? 
UPDATE SYSTOOLS .HMON_ATH_INFO SET TO_WAIT : ?, LAST_WAIT = 3?, STATS _LOCK = ‘N'’, STATS_STATE : ?, $E 
3ELECT x FROM “aCDOM_CARD_PARAM” WHERE “CLIENT = ?> AND “PARAM_NAME” = ?> AND “PARAM_INDEX%” := ? 
INSERT INTO “2CDM_CARD_LOG™” UALUES( ? ，? 

3ELECT “CONTRACT_INT® , “PRENOTE® ， ， PRENOTE_TYPE” ， ” MEDIUM , 
SELECT x FROM “BPOO1”UWHERE “CLIENT” = ? AND “PARTNER” = ? WITH UR -- DPTLEUELL 3 ) -- QUERY_DEGR 
3ELECT 关 FROM “2<CDOM_TRNY_CHNL WHERE “CLIENT” -> ? AND “CHRNNEL = > FETCH FIRST 1 ROWS ONLY DOPTIH 


图 11-5 最 消耗 资源 的 12 条 SQL 语句 


营 账 分 析 系 统 调 优 建议 

检 答 资源 消耗 最 大 语句 的 执行 计划 ， 看 看 是 否 有 全 表 扫 措 。 

建立 合适 的 索引 并 对 大 表 考 虑 使 用 表 分 区 技术 。 

将 排名 匪 前 语句 的 表 数 据 与 索引 分 别 存储 。 

对 这 些 SQL 语句 分 别 全 看 执行 计划 ， 在 统计 信息 正确 的 情况 下 使 用 db2advis 工具 
生成 索引 建议 。 


ee e ee] 


调整 后 的 I/O 情况 如 下 所 示 


长 二 电工 memory page faults cpu 
rr bb p avm fre | Wa 
a 1 T36680 号 36 E13 QO 日 103 231 123 21663 2560694 4 YY 21 ‘2a 
0 0 0 T97370 617280 叶 0 0 0 0 D 2849 20606 1139 99 4 32 5 
2 Td06 GEEES3 0 TL62 如 妆 0 0 2899 19424 TiOL 48 5 3 13 
3 9 zz 1l906686 G11963 0 0 0 0 0 0 2889 19406 8124 36 4 31 9 
9 0 2 1596086 6171963 0 0 和 0 0 0 241> 12492 6682 46 4 48 3 
ll6 0 4 1596688 617961 0 0 0 0 0 0 3621 194/1 8622 /4 9 11 6 
9 H 0 T39982 1666% 0 0 0 0 0 0 2718 20368 6493 14 > lo 6 
2 0 2 15396688 6171961 0 0 0 0 0 0 2343 13304 6307 41 3 44 6 
2 T9669 F795 0 0 0 0 0 0 2192 1iod6 1031 62 4206 1 
I 33908013 G16633 0 0 0 0 0 0 3293 20440 6911 69 8 11 6 
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LO 等 待 值 由 原来 的 30% 以 上 下 降 到 了 10% 左 右 ， 个 别 时 间 甚 至 降 至 10% 以 下 。 等 待 
物理 IO 操作 的 进程 数 由 40 多 个 下 降 到 了 几 个 。 


6. 案例 总 结 


PT es | 


在 这 个 案例 中 ， 造 成 彰 账 分 析 系 统 啊 应 时 间 慢 的 主要 原因 是 存在 大 量 的 IO 等 待 ， 而 
造成 IO 等 得 的 原因 有 商 个 ; 一 是 因为 在 最 初 的 存储 规划 设计 时 没有 正确 合理 地 分 布 数据 ; 
二 是 数据 库 中 条 些 复杂 的 SQL 语句 未 创建 合理 的 索引 。 

经 过 调整 ， 稼 账 分 析 系 统 的 速度 大 大 提高 ， 前 人 台 客户 的 啊 应 时 间 大 大 减少 ， 可 以 充分 
满足 客户 需求 。 


11.2 ” 调 优 案例 2: 某 银行 知识 库 系 统 锁 等 待 、 锁 升级 引起 
性 能 瓶颈 

1. 案例 简介 

某 家 银行 知识 库 系 统 ， 数 据 库 中 出 现 大 量 锁 等 竺 和 锁 升 级 ， 前 台 最 终 用 户 的 啊 应 时 间 
无 法 满足 正常 业务 需求 。 

2. 问题 描述 

主要 表现 在 对 最 终 用 户 的 交互 啊 应 不 如 预期 ， 尤 其 在 业务 繁忙 时 更 是 无 法 得 到 及 时 的 
区 互 啊 应 。 从 主机 系统 上 观察 ， 主 要 表现 在 系统 的 CPU 使 用 比较 高 ， 数 据 库 中 存在 大 量 的 
连接 ， 每 个 连接 都 需要 处 理 很 长 时 间 。 

3. 性 能 优化 步骤 

(1) 建立 性 能 调整 目标 : 啊 应 时 间 能 够 满足 客户 要 求 。 

(2) 检查 系统 中 所 有 便 件 系统 ， 确 认 便 件 没 有 问题 。 

(3) 检查 AIX 内 核 参 数 和 DB2 参数 设置 是 否 合理 。 

(4) 监控 数据 库 运 行 ， 检 碍 数据 库 中 每 个 session 的 执行 情况 。 

(5) 监控 数据 库 运行 ， 找 到 锁 升 级 的 表 名 和 锁 等 待 的 锁链 。 

(6) 调整 数据 库 参 数 或 协助 优化 SQL 语句 ， 以 减少 获取 锁 的 数量 。 
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性 能 问题 的 定位 、 优 化 措施 和 建议 


本 案例 排查 所 有 硬件 环境 ， 都 没有 发 现 异常 。 只 能 检查 db2diag.log， 在 数据 库 诊 断 日 
志 中 发 现 如 下 信息 : 


二 林村 生机 和 下 和 Instance:db2instl1l Node:000 

PID:660232 (db2agent (kdbdb) 0) 下 
data management sqldEscalateLocks Probe:3 Database:KDBDB 

ADMS502W The escalation of "19" locks on table "KDB .0O ORG INEO" to lock 
lintent "SsS" was successful. 

20D8-08-31 16.16.20.182935 Instance:db2instl1l Node:000 

PID:1405022 (db2agent (kdbdb) 0) TID:1 App1Id:GB9C4D16-D82C.011C17D7131B 
data management sqldEscalateLocks Probe:3 Database:KDBDB 

ADM5502W The escalation of "21"” locks on table "KDB .TREE™ to Lock i1ntent 
WAS SUCcCeESSstulbs 

20080831--16.165.13. T700960 Instance:db2instl1 Node:000 

PID:1323556 (db2agent (kdbdb) 0) TID:1 Appid:GB9C4D16.D664.011C17D5A27F 
data management sqldEscalateLocks Probe:3 Database :KDBDB 

ADM5502W The escalation of "18"” locks on table "KDB .O OPERATOR INFO" to 
lock intent "S" was successful. 

2008 8 3L T6613 T09943 Instance:db2instl1l Node:000 

PID:1237448 (db2agent (kdbdb) 0) TID:1 Appid:GB9C4D16.D5AE.011C17D57040 
data management sqldEscalateLocks Probe:3 Database:KDBDB 

ADM5502W The escalation of "3380" locks on table "KDB .TREE" to lock 
intent "SsS™ was suCccessful. 

2008- -0003L.—16014:31s351320 Instance:db2instl1 Node:000 

PID:1114452 (db2agent (kdbdb) 0) TID:1 Appid:GB9C4D16 .D5B2.011C117D57126 
data management sqldEscalateLocks Probe:3 Database:KDBDB 

ADM5502W The escalation of "3" locks on table "KDB -PDATE TREE” To Lock 


Trernt MTom as ocCessStial 


表 kdb.tree、kdb.update tree、kdb.O 〇 OPERATOR INFO 和 kdb. O_ ORG INFO 这 4 张 
表 经 第 存在 S 锁 升 级 现象 ， 这 严重 影 啊 数据 库 的 性 能 。 
通过 快照 监控 及 现 数据 库 中 存在 大 量 锁 等 行 : 
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Database Lock Snapshot 
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Database name = DEV 

Database path = /db2/DEV/db2dev/NODEO0000/SOLOO0001/ 
Input database alias = DEV 

LocCks held = 49 

Applications currently connected = 38 

Agents currently waiting on locks = 6 

snapshot timestamp “D8 33120008 153:26:00.33LL34 
Application handle = 6 


Application ID 
Sequence number 


= *LOCAL.db2dev.030815021001 
“000l 


Application name = disp+work 
Authorization ID = SAPR3 
Application status = UOW Waiting 
Application code page = 819 

Locks held 二 

Total wait time (ms) = 
Application handle = 97 


Application ID 
Sequence number 
Application name 
Authorization ID 
Application status 
status change time 


= *LOCAL.db2dev.030815060819 
= 0001 

= 

一 SAPR3 

= LocKk-wait 

DB—312008 lo:0820. 302352 


Application code page = 819 
Locks held = 6 
Total wait 七 Ime (ms) = 1060648 
Subsection waiting for lock = 0 
ID of agent nolding lock = 100 
Application ID holding lock = *LOCAL.db2dev.030815061638 
Lock object type = Row 


Lock mode = EXCIUSIVe Lock (Xx) 
Lock mode requested = Exclusive Lock (Xx) 
Name of tablespace holding lock PSoAPBEABD 
schema of table holding lock = KDB 

Name of table holding lock = TREE 


Lock wait start timestamp 


i 


1) 问题 处 理 过 程 


(1) 首先 检查 数据 库 配 置 并 进行 性 
经 过 查看 数据 库 的 配置 参数 和 数据 库 的 性 能 监控 ， 发 现 数据 库 中 的 锁 内 存 (locklist) 参 


sb 


中 六 


HE 


和 
LL 


曾 区 


08—31—=2008 Lo:08:20.3023260 


第 11 章 DB2 调 优 和 案例、 问题 总 结 和 技巧 


数 为 10240, 在 监控 数据 库 中 发 现 该 值 (locklist) 的 使 用 高 水 位 已 经 达到 最 大 值 ， 所 以 首先 调 
整 该 参数 ， 把 它 调整 为 20480: 


db2 update db cfqg for kdbdb using locklist using locklist 20480 


调整 后 继续 监控 数据 库 ， 发 现 锁 内 存 的 使 用 高 水 位 仍然 达到 最 大 值 ， 所 以 这 个 时 候 怀 
疑 是 大 量 应 用 没有 释放 锁 才 导致 即使 分 配 了 更 多 的 锁 内 存 ， 也 仍然 无 法 满足 要 求 。 这 种 情 
况 下 考虑 从 应 用 程序 SQL 入 手 。 

(2) 找 出 引起 锁 等 待 的 SQL 语句 

执行 db2 get snapshot for dynamic sql on kdbdb |sort -$ +] > top.sql grep -E "Total 
execution time " top.sql > time.sql sort -$ +]1 time.sql， 发 现 这 样 一 条 SQL 语句 的 执行 时 间 竟 
然 花费 22808 秒 : 

Total execution time (sec.ms) = 22808.2574 秒 

利用 db2pd 工具 找 出 具体 的 引起 锁 等 待 的 SQL 语句。 

要 找 出 友 生 锁 等 待 时 持 有 哪个 锁 ， 我 们 使 用 db2pd 实用 程序 。 为 了 阅读 方便 ， 下 面 对 
db2pd 输出 进行 了 修改 ， 删 除 除 了 锁定 的 行 以 外 的 所 有 行 : 


/home/db21instls$db2pd -db locktest -locks Show detail 


LOCKS : 

Address TranHdl Lockname Type MoOde STs 
Owner Duar Hldcnt LE RISe 

Ox402C0 EO 3 000200020000000A0000000032 ROW 1 

多 1 0 8 0x40 TbspaceID 2 TablelID 2 RecordID UXA 
0x402C02E0 2 000200020000000A0000000032 ROW -NS W 

3 1] 0 0 0x0 TbspacelD 2 TablelID 2 RecordID OxA 
0x402C03A8 2 00020002000000090000000052 Row 本 

2 1 如 8 0xA40 TbspacelID 2 TablelID 2 RecordID 0x9 


可 以 看 到 , DB2 持 有 TbspaceID 2 表 空 间 中 TableID 2 表 上 的 锁 。 现 在 找 出 这 是 哪个 表 : 


/home/db21instl1 $db2 "select Substr (tabschema ,1 ,9) as tabschema, 
substr (tabname,1,12) as tabname, tableid, tbspaceid 
from syscat.tables 
where tbspaceld = 2 and tableid = 2" 

TABSCHEMA TABNAME, TABLEID TBSPACEID 

KDB TRERbE, 2 2 

1 record(s) selected. 


上 面 的 db2pd 输出 提供 了 被 锁定 的 行 的 记录 标识 (RID)。 值 0xA 实际 上 表示 0x0000000A， 
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RID 是 由 一 个 三 字符 页 号 (这 里 是 0) 和 一 个 单字 人 符 slot 标识 (这 里 是 0xA, 也 就 是 10) 组 成 的 
4 字符 字段 。 它 告诉 我 们 所 关注 的 这 一 行 是 在 表 的 第 0 页 的 slot 10 中 。 每 个 数据 页 最 多 有 
255 个 “slot”， 它 包含 给 定 行 在 页 中 的 偏 移 量 。RID 通常 描述 为 (页 号 ;slot 数 )， 也 就 是 
F 进 制 的 (0: 10)、 二 进 制 的 (0; A)。RID 唯一 地 标识 了 表 中 的 一 行 。 

输出 表明 等 待 的 是 db2pd 输出 中 的 行 (0; A) 上 的 锁 ， 因 为 提供 锁 请 求 状 态 的 Sts 列 显 
示 W， 表 示 等 待 。 其 他 锁 的 状态 为 G， 表 示 授 予 (granted)， 因 此 它们 被 持 有 。 

因此 ， 总 结 有 天 的 人 锁 : 

e 具有 TranHdl 2 的 代理 : X 锁 对 于 主 表 行 (0; 9) 为 GRANTED( 由 于 未 提交 的 插入 )。 

e 具有 TranHdl3 的 代理 : X 锁 对 于 主 表 行 (0; A) 为 GRANTED( 由 于 未 提交 的 插入 )。 

e 具有 TranHdl 2 的 代理 :NS 锁 对 于 主 表 行 (0: A) 为 WAITING( 由 于 选择 )。 

运行 select 语句 的 代理 等 待 的 行 是 值 为 NODE ID=62481 的 行 ， 而 不 是 它 刚才 更 新 的 
行 。 可 以 推断 由 于 更 新 的 行 上 有 XX 锁 一 一 新 更 新 的 行 独占 性 地 锁定 ， 耻 a 到 更 新 被 提交 。 同 
时 , 一 个 代理 不 能 等 等 它 自己 ,如 果 一 个 代理 对 于 它 已 经 拥有 独占 (X) 锁 的 行 请 求 共 享 (NS) 
锁 ， 那 么 这 个 请 求 会 被 授予 ， 因 为 已 经 拥有 了 一 个 具有 足够 或 更 局 模式 的 锁 。 通 过 db2pd 
定位 友 现 引起 锁 等 竺 的 SQL 语句 如 下 : 

select * from ( select TOownuamne 问 over(torder by tt.AUDIT DATE DESC)Y as 
rownumber ,ut.MODI ID,ut.NODE ID,ut.NEWNODE TEXT,Org.O0ORG NAME orgname., 
Dorg .ORG NAME borgname, ut.FUNCTION ID, ut.NEWNODE LINK, ut.AUDIT DATE., 


t.NODE ID tNodelId 
from 


kdb.update tree ul Te on kdb:0O OPERATOR INEO Op Aon lt OP CODE = 
OP .OPERATOR CODE 

Te on kab OO ORG TNED Org on org ORG CODE — yt OBRG CODE 

left Join kdb-0 ORG INFO Borg on borg.ORG CODE = Ut.B ORG CODE Left Join 
Kdb.TREE ton t.NODE TD = ut:NODE ID 

where OP-OPERATOR ROLE = 9003100004" and ut .ORG CODE Is not null and 
Qt OR LODE Co and at AUDIT DATE 13 net nall and ( (ut.NEWNODE LINK 1s not 
null and ut.NEWNODE LINE != ) or ut.KEY VALUE = 3 ) and ut.B ORG CODE 1n 
("5100000007,"360000000",'6500000007, "540000000","130000000", "120000000",'6 
200000007, "500000000", "340000000", "150000000; "520000000", "322000000","6100 
00000" ， "210000000 7 2300000007， "422000000"; "212000000",; "T4530000000',;, "6300000 
00" "530000000'" "640000000"” ， "220000000" ， "460000000","140000000"; "010210000" 
-O10210106 .010210000”Y and nat AUDIT FLAG = 2 and mt FUNCTION TID'— "3" and 


ut. FUNCTION ID I 74" and ut. INEFO TYPE concat ut. B ORG CODE <> D0010210000" order 
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By ut.AUDET DATE DESC as Temp where rownmnmberi2 1% 


与 应 用 人 员 交 流 ， 发 现 这 条 SQL 语句 的 执行 次 数 特别 多 ， 对 该 SQL 语句 的 执行 时 间 


db2batch -dd kdbdb -ff 1.sgl 


发 现 这 条 SQL 语句 的 执行 时 间 大 概 在 3 秒 左 右 ( 如 果 资 源 紧 张 ， 执 行 时 间 会 更 长 )， 
条 SQL 语句 会 导致 表 kdb.tree、 kdb. update tree、kdb.O OPERAIOR INFO 和 kdb.O ORG 
INFO 这 4 张 表 经 党 发 生 S 锁 升 级 现象 。 在 kdb.tree 发 生 S 锁 升 级 后 ,进而 会 导致 另外 一 条 
经 节 执 行 的 SQL 语句 |: 

update kqdb .TREE set HIT RATIO = HIT RATIO +1 where NODE ID=?( 此 处 为 参数 标记 ， 
用 62481 实际 值 代替 ) 

出 现 锁 等 每 现象 (locktimeout), 那么 在 这 条 语句 出 现 锁 等 每 的 阻 蛙 后 , 进而 会 影 啊 后 续 
的 SQL 语句 : 

"select * Trom ( Selecc rownumber(} over (order by ut.AUDIT DATE DESC} as 
rownumber ， ut .MODI ID,ut.NODE ID,ut.NEWNODE TEXT,oOrg.0RG NAMP 


orgname, borg .ORG NAME, 
borgname, ut .FUNCTION ID,ut .NEWNODE LINK,UuUt.AUDIT DATE,t.NODE ID tNodeld 


from kdb.update tree ut left Join kdb.0 OPERATOR INFO op on ut.0P CODE = 
op -OPERATOR CODE left ]oln kdb.0 ORG INFO org on org.O0RG CODE 
= Ut .ORG CODE left Join kdb.0 ORG INFO borg on borg.0ORG CODE = 
ut.B ORG CODE left Join kdb.TREE t on t.NODE ID = ut.NODE ID where 

OP -OPERATOR ROLE = "9003100004" and Ut-ORG CODE 1s not null and 

Ut .ORG CODE I!= "" and ut .AUDIT DATE 15 not null and {(ut.NEWNODE LINK 1s 
not null and ut .NEWNODE LINK ‘= ”) or ut.KEY VALUE = 3) and ut.B ORG CODE 


in (5100000007, "360000000"', "650000000", "5400000007, "130000000",， "1]200000007"， 


62z0000000”， 200000000” ,340000000 ,1930000000 ,5320000000" 322000000 ， 日 1 
DUOO0U000 ， 210000000  ，230000000 -422000000 "  ，212000000 - ， 450000000 "63000 
U000 ， 530U000000 ， 640000000 ， 220000000 ， 460000000 ，140000000 ，， 01021000 
L0210000" ,0102170000] angd TAUDIT FLAG— “2 ang ut FINCTION TD :3 
and ut .FUNCTION ID = “4" and ut.INFO TYPE concatl tt.B ORG CODE <> “0010210000" 
order by or nr DATE DESCYY as tem uhere Townimber ae 


这 样 就 会 出 现 大 量 的 锁 不 释放 ， 而 连接 不 释放 又 导致 数据 库 连 接 耗 尽 。 这 是 造成 数据 
库 问题 的 根本 原因 。 

造成 问题 的 主要 原因 是 : 由 于 SQL 语句 执行 时 间 过 长 ， 导 致 这 条 SQL 语句 引起 级 联 
的 后 续 阻 塞 ， 这 样 一 来 ， 连 接 不 释放 ， 锁 不 释放 ， 直 到 把 数据 库 的 连接 耗 尽 和 锁 内 存 达到 
最 大 值 。 
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2) 问题 总 结 

Q 建议 如 有 必要 ， 在 这 条 SQL 语句 的 后 面 加 上 with ur 参数 ， 这 样 该 SQL 语句 在 读 
取 时 束 不 会 在 所 应 用 的 4 张 表 上 加 S 锁 ， 从 而 可 以 把 这 个 问题 解决 择 。 这 需要 和 业务 人 员 
沟通 ， 让 他们 评 佑 这样 做 对 籽 务 是 否 有 影 啊 。 

对 这 条 SQL 语句 考虑 能 人 否 优 化 逻辑 。 

(3) 利用 db2advis 工具 为 这 条 SQL 语句 生成 索引 建议 。 

为 什么 以 前 没有 出 现 这 个 问题 呢 ? 判断 是 随 寿 数据 库 中 表 的 数据 量 和 业务 的 增多 
导致 的 ， 有 原来 数据 量 小 的 时 候 ， 这 个 问题 暂时 没有 表现 出 来 。 

名 检查 数据 库 的 统计 信息 是 否 为 最 新 ， 人 否则 更 新 统计 信息 。 

@ 检查 DB2 EVALUNCOMMITTED 注册 变量 。 这 个 设置 使 DB2 不 必 事 先 在 CS 或 
RS 隔离 级 别 锁 住 一 行 才 判 断 SARGable 谓词 ,这样 在 我 们 确定 这 一 行 满足 谓词 之 前 ， 它 不 
会 锁 住 。 不过, 访问 未 锁定 的 数据 可 能 会 有 副作用 (比如 这 个 注册 变量 的 设置 改变 了 隔离 级 
别 )， 不 是 每 个 业务 都 能 接受 这 个 副作用 的 ,因此 在 使 用 这 个 功能 之 前 对 它 加 以 了 解 是 很 重 
要 的 。 关 于 该 参数 的 详细 描述 ， 参 见 “ 第 5$ 章 : 锁 和 并 发 ”。 

@ 检查 DB2 SKIPINSERTED 注册 变量 。 这 个 变量 控制 未 提交 的 插入 在 CS 或 RS 隔 
离 级 别 下 是 否 可 以 被 游标 忽略 。 局 用 这 个 变量 会 使 未 提交 的 插入 被 当成 它们 完全 没 被 插入 
一 样 处 理 。 同 样 ， 这 种 行为 也 许可 以 被 接受 ， 也 许 不 能 被 接受 ， 因 此 了 解 它 的 隐 含 后 果 很 
重要 ， 需 要 和 开发 人 员 沟 通 。 关 于 该 参数 详细 摘 述 ， 参 见 “ 第 $ 章 : 锁 和 并 发 ”。 

(8) 目前 数据 库 中 最 影响 应 用 的 是 如 下 几 条 SQL 语句 , 分 别 对 这 些 SQL 语句 分 析 执 行 
计划 ， 找 出 消耗 资源 的 操作 ， 并 调用 db2advis 进行 索引 建议 : 

select * from ( select Fownumber () overl(order by ut.AUDIT DATE DESC)} as 
rownumber ,ut.MODIT ID,ut.NODE ID,ut .NEWNODE TEXT,oOrg.ORG NAME orgname, borg. 
ORG NAME borgname,ut.FUNCTION ID,ut.NEWNODE LINK, ut.AUDIT DATE, t.NODE ID 
tNodeId from kdb.update tree ut left Join kdb.0 OPERATOR INEO op on ULt-OP CODE 
= OP .0PERATOR CODE 

left Join kdb.0 ORG INFO org on org.O0RG CODE = ut.ORG CODE 

left Join kdb.0 ORG INFO borg on borg-ORG CODE = ut-B ORG CODE 

left Join 

kdb .TREE tt on t.NODE ID = ut.NODE ID 

where 

Op-OPERATOR ROLE = “9003100004" 

and UE.ORG CODE 15 not nulil 

and UL.ORG CODE |!= "" 

Aand ut.AUDIT DATE 1s not null 


and ((ut.NEWNODE LINK 15 not null 
and ut .NEWNODE LINK SE Ut .KEY VALUE 
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= 731) and ut.B ORG CODE in ( 510000000, '360000000", "6500000007", 
ddU000000 ， “130000000 ， 1L20000000 ， 620UD000000 ， "300000000"， “340000000"， 
“1150000000 ， 5520000000 "322000000", “610000000", "210000000"， “230000000 ， 
422000000" ,212000000" 42520000000 ，， 630000000 ， 3000U0U000 ， 640000000 ， 22 
0000000" ， 460000000 ， 1 40000000 ， 010210000 “010210100", "010210000°") 


nd UE-AUDIT TAG — 2 
and EFEUNCTION TD 7— 3 
and ut.FUNCTION ID =— "#4 


and ut.INFO TYPE 

concat ut.B ORG CODE <> "O00107210000" orgder by ut.AUDIT DATE DESC ) 
as temp 

ee TOWNmber< 


select oorginfos0 .PARENT ORG as PARENT2 1 , oorginfos0 -ORG CODE as 
ORG1 1 ,oorginfos0 .ORG CODE as ORG1 2 0 , oorginfos0 .PARENT ORG as 
PARENT2 2 0 , oorginfos0 -ORG NAME as ORG3 2 0 ,， oorginfos0 -ORG TYPE as 
ORG4 2 0 ，Gorgqlnftos0 .OP CODE as OP5 2 0 ,， oo0orginfos0 -ADMIN CODE as 
ADMIN6 2 0 from KDB.O ORG INFO oo0rginfos0 where oo0rginfos0 .PARENT ORG—?; 


Bpdace OD. TREE SEC HIT RATIO — HET BATIOTIL wheare NODE TD T1904 
通过 下 面 的 脚本 监控 ， 发 现 引起 锁 等 待 的 SQL 语句 主要 是 以 下 这 3 条 : 


Select Substristmt 上 EXE lr Trom 
table (snapshot statement ('KDBDB',—1)) a where a.agent id in 
(select agent Id hong Lk Trom 
able (snapshot lockwait ('KDBDB',—1)) b ); 
Update TREE SeLl HET RATIOQ = HET RATIO FT LT vhere NODE TD—5d101 
update TREE Set HIT RATIO = HIT RATIO + 1 Where NODE ID=—32312 
select * from { select rownumber () DOVer (order by ut.AUDIT DATE DESC) 
as rownumber ,; ut.MODI ID,ut.NODE ID,ut.NEWNODE TEXT, 
update TREE se HIT PATIO = HIT BATIO + .| where NODE TD—13132 
select ™ Trom ( select Tovwnumber() overtorder Dy EAUDIT DATE DESC) ‘as 


rownumber ， ut .MODI ID,ut .NODE ID,ut.NEWNODE TEXT, 
select * from { select rownumbert) overlorder by ut .AUDIT DATE DESC}Y as 
rownumber ， ut .MODI ID,ut.NODE ID,ut.NEWNODE TEXT, 


select * from ( select roOwnumbert}) overiorder by tAUBIT BATE BESC}Y as 
rownumber ， ut .MODI ID,ut.NODE ID,ut.NEWNODE TEXT, 


最 后 ， 上 述 问题 通过 创建 合理 的 索引 (调用 db2advis) 和 调整 部 分 SQL 语句 的 隔离 级 别 
得 到 了 完整 解决 。 


465 


DB2 数据 库 性 能 调整 和 优化 (第 3 版 ) 


5. 调 优 总 结 


在 这 个 性 能 调整 的 过 程 中 ， 我 们 利用 了 db2pd、 快 照 监控 表 函 数 来 监控 锁 等 待 。 这 些 工 
具 收 集 的 信息 使 我 们 可 以 理解 锁 会 被 持 有 的 原因 ， 这 又 可 帮助 我 们 确定 避免 不 必要 的 锁定 
的 策略 和 技术 。 有 了 这 些 信息 ， 任 何 需 要 了 解锁 定 的 人 痢 可 以 将 这 里 使 用 的 技术 和 原则 应 
用 到 目 己 的 场景 中 ， 并 得 出 类 似 的 分 析 和 建议 。 同 时 ， 在 找 出 引起 锁 等 竺 的 SQL 语句 后 ， 
我 们 调用 db2expln、db2exfmt 和 db2advis 工具 来 分 析 执行 计划 并 创建 合理 的 索引 。 


11.3” 调 优 案例 3: 东 汽 车 制造 商 ERP 系统 通过 调整 统计 
信息 提高 性 能 


1. 案例 简介 
革 汽 车 制造 公司 ERP 系统 出 现 性 能 瓶颈 。 
2. 问题 描述 


主要 表现 在 对 最 终 用 户 的 交互 啊 应 不 如 了 预期， 尤其 在 业务 繁忙 时 更 是 无 法 得 到 及 时 的 
交互 啊 应 。 用 户 使 用 的 是 DB2 V8.2.4 数据 库 ， 运 行 在 IBM P670 上 ， 配 置 8C16G。 


3. 性 能 优化 步 又 


(1) 建立 性 能 调整 目标 : 响应 时 间 能 够 满足 客户 要 求 。 

(2) 检查 系统 中 所 有 便 件 系统 ， 确 认 人 硬件 没有 问题 。 

(3) 检查 AIX 内 核 参 数 和 DB2 参数 设置 是 否 合 理 。 

(4) 监控 数据 库 运行 ， 找 到 执行 时 间 较 长 和 执行 次 数 较 多 的 SQL 语句。 
(5) 分 析 调整 SQL 的 执行 计划 ， 降 低 执行 时 间 ， 满 足 性 能 目标 。 


4. 性 能 问题 的 定位 、 优 化 措施 和 建议 


在 这 个 案例 中 ， 我 们 通过 监控 发 现 硬 件 存储 IO 设计 、 操 作 系 统 相 关 配 置 参数 、 数 据 
库 配 置 参数 等 都 没有 问题 ， 而 且 SQL 语句 相对 比较 简单 ， 没 有 什么 可 以 优化 的 余地 ; 同时 
在 表 上 也 有 相应 的 索引 。 乍 一 看 ， 好 像 没 有 什么 可 以 调整 的 ， 只 能 添加 硬件 资源 了 。 但 是 
通过 我 们 对 客户 业务 逻辑 的 分 析 ， 结 合 数据 库 内 相关 表 的 情况 ， 我 们 仔细 研究 发 现 该 公司 
数据 库 中 访问 最 频繁 的 表 CARS 有 如 下 特征 : 

e 生产 的 每 一 辆 汽车 ， 在 表 中 都 有 相应 的 一 行 记 录 。 
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e 每 辆 汽车 可 以 由 它 的 ID 来 标识 ， 因 此 “ID” 是 表 “CARS” 的 主键 (PK)。 
此 外 ， 表 中 有 一 个 “STATE” 列 ， 表 明 汽 车 当前 处 在 制造 流程 中 的 哪 一 步 。 一 辆 
汽车 的 制造 流程 从 第 1 步 开 始 ， 然 后 是 第 2 步 、 第 3 步 、.…、 第 49 步 、 第 50 步 、 
第 $1 步 、.…、 第 98 步 、 第 99 步 ， 一 直到 第 100 步 一 -第 100 步 意味 看 汽车 已 经 
完工 了 。 已 完工 的 汽车 所 对 应 的 行 仍然 保留 在 表 中 ， 后 续 流 程 (例如 投诉 管理 、 质 
量 保证 等 ) 仍 要 用 到 这 些 行 。 

e 汽车 制造 商 生 产 10 种 不 同型 号 (“TYPE” 列 ) 的 汽车 。 为 了 简化 问题 ， 在 这 个 示例 
表 中 ， 各 种 汽车 型 号 命名 为 A、B、C、D、...、J。 

e 除 主键 索引 (在 “ID” 列 上 ) 外 ,“STATE” 列 上 有 一 个 索引 (“I STATE?”)，“TYPE” 
ET 

实际 上 ，“CARS” 表 包含 的 列 远 不 止 “ID”、“STATE” 和 “TYPE”。 为 了 保护 商 

业 秘 密 和 便于 举例 ， 在 我 们 的 示例 表 中 没有 出 现 其 他 列 。 
上 述 信息 给 了 我 们 一 些 提示 ， 我 们 可 以 试图 在 统计 信息 上 面 做 些 调 优 工作 以 提高 性 能 。 
首先 我 们 再 温习 一 下 统计 信息 (详细 内 容 参 见 “ 第 8 章 : 统计 信息 更 新 与 俯 瞩 整理”)。 


1) 分 布 统计 信息 的 类 型 一 一 频率 (frequency) 统 计 信 息 和 分 位 数 (quantile) 统 计 信息 


假设 表 CARS 现在 有 大 约 1 000 000 条 记录 , 不 同 的 型 号 在 表 中 出 现 的 频率 如 表 11-1 
所 示 。 


表 11-1 表 CARS 中 TYPE 列 的 频率 统计 信息 
TYPE COUNT(TYPE) 
506135 
301985 
104105 


92492 


B 
C 
D 
上 19584 
F 10123 
G 4876 
H A4589 
I 4403 


J 3727 
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型 号 为 A 有 因此 生产 的 汽车 中 大 约 有 50% 是 这 种 型 号 。 型 
号 也 和 型 号 C 仅 次 于 型 号 A, 分 别 占 所 有 汽车 的 30% 和 10%。 其 他 所 有 型 号 加 在 一 起 仪 占 
10%。 

表 11-1 显示 了 “TYPE” 列 的 频率 统计 信息 。 通 过 基本 统计 信息 ，DB2 优化 器 只 能 了 
解 到 该 表 包 含 1 000 000 行 ( 表 的 基数 ) 和 10 种 不 同 的 值 (型 号 ), 即 A 到 了。 如 果 没 有 分 布 统 
计 信 息 ， 优 化 器 会 认为 每 种 值 以 相同 的 频率 出 现 ， 大 约 都 是 出 现 100 000 次 。 而 一 旦 生成 
关于 “TYPE” 列 的 分 布 统计 信息 ， 优 化 器 即 可 了 解 每 种 型 号 真正 的 出 现 频率 。 因 此 ， 优 化 
占 消 楚 各 种 已 有 型 号 出 现 的 不 同 频率 。 

优化 器 使 用 频率 统计 信息 来 计算 用 于 检查 相等 或 不 等 谓词 的 过 滤 因 子 。 例 如 : 


SELECT * FROM CARS WHERE TYPE = "H' 


分 位 数 统计 信息 

与 频率 统计 信息 不 同 ， 分 位 数 统计 信息 与 个 同 全 的 出 现 频 紊 无 天 ， 而 与 表 中 有 多 少 行 
小 于 或 大 于 某 个 值 (或 者 有 多 少 行 介 于 两 个 值 之 间 ) 相 关 。 分 位 数 统计 信息 提供 关于 一 个 列 
中 的 值 是 否 聚合 (avg、max、sum、min 和 count) 的 信息 。 为 获得 这 样 的 信息 ，DB2 假定 列 
的 值 是 按 升 序 排列 的 ， 并 根据 正则 行 间隔 确定 相应 的 值 。 

我 们 来 看 看 表 CARS 中 的 “STATE” 列 ， 该 列 按 升 序 排列 。 根 据 正则 行 间隔 ， 即 可 确 
定 “STATE” 的 对 应 值 。 表 11-2 显示 了 CARS 表 中 STATE 列 的 分 位 数 统计 信息 。 


表 11-2 CARS 表 中 STATE 列 的 分 位 数 统计 信息 


COUNT(row) STATE ASC 

5479 ] 

354948 10 
109990 21 
1598835 31 
2150350 42 
2065231 3 
320167 03 
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( 续 表 ) 
COUNT(row) STATE ASC 

370037 13 
4248 72 84 
4753087 94 

504298 100 

100 

1012019 100 

由 于 已 完工 的 汽车 仍然 没有 从 CARS 表 中 删除 ， 因 此 状态 为 100( 三 完工 ) 的 汽车 数量 


比 所 有 处 于 其 他 状态 的 汽车 总 和 还 多 。 已 完工 的 汽车 占 表 中 所 有 记录 的 50%。 


注意 : 

在 实际 情况 下 ， 已 完工 的 汽车 数量 其 至 还 要 更 多 (例如 超过 99%)。 在 稍 后 的 具体 例子 
中 可 看 到 这 种 情况 ，。 

表 11-2 显示 了 了 “STATE” 列 的 分 位 数 统 计 信 息 。 有 了 这 种 关于 有 和 多少 行 分 别 小 于 和 大 
于 确定 值 的 信息 ， 优 化 器 即 可 计算 出 用 于 测试 小 于 (小 于 等 于 )、 大 于 (大 于 等 于 ) 或 介 于 两 值 
之 间 的 谓词 的 过 滤 因 子 。 例 如 : 


SELECT * FROM CARS WHERE STATE < 100 
SELECT * FROM CARS WHERE STATE BETWEEN J0 AND 10 


根据 已 有 的 分 位 数 统计 信息 计算 出 来 的 过 滤 因 子 不 是 很 精确 ， 但 即使 只 收集 20 个 值 ， 
其 误 兰 仍然 低 于 5%。 


2) DB2 优化 器 对 分 布 统计 信息 的 使 用 一 一 调 优 积 例 
来 看 一 下 我 们 调 优 的 这 个 案例 ， 在 此 案例 中 ，DB2 优化 器 可 以 使 用 分 布 统计 信息 来 更 
合理 地 估计 过 滤 因 子 ， 以 便 生 成 更 好 的 访问 计划 。 
下 面 这 个 示例 查询 从 已 经 定义 好 的 CARS 表 中 读 取 数 据 。 对 于 表 CARS 中 的 汽车 数 
据 ， 有 以 下 假设 : 
e 该 表 的 基数 为 1 000 000， 也 就 是 说 该 表 包 含 1 000 000 行 。 
e 表 中 99.9% 的 汽车 是 已 经 完工 (“STATE” 列 = 100) 的 ， 这 些 汽车 的 相关 信息 必须 
体 留 ， 以 用 于 后 续 处 理 (投诉 管理 、 质 量 保证 等 )。 剩 下 的 1 000 辆 汽车 目前 还 处 在 
制造 流程 中 。 
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e 在 该 表 中 ， 制 造 商 提供 的 从 A 到 J 的 10 种 不 同 汽车 型 号 (“TYPE” 列 ) 几 乎 以 相同 
的 频率 出 现 。 

e 为 了 便于 读者 做 这 个 实验 ， 我 们 对 客户 这 个 表 做 了 修改 ， 建 议 大 家 按照 下 面 的 脚 
本 在 你 的 数据 库 中 创建 表 并 导入 数据 : 


db2 +c -tvf create table cars.sql-———-———-— 执行 时 ， 把 注释 去 掉 
DROP TABLE DB2INSTI1 .CARS:; 
CREATE TABLE DB2INST] .CARS 
( ID CHAR(13) FOR BIT DATA NOT NULL PRIMARY KEY, 
TYPE CHAR(10) NOT NULL, 
STATE SMALLINT NOT NULL) ) NOT LOGGED INITIALLY:; 


INSERT INTO DB2INSTL1 .CARS (ID, TYPE, STATE) 
Dc 使 用 了 表 的 表达 式 

WITH TEMP (COUNTER, ID, TYPE, STATE)} AS 

( VALUES (0, GENERATE UNIQUE()}, "A, 100) 


UNION ALL SELECT (COUNTER + 1}., GENERATE UNIQUE () ， 
CHRIMOD({INT(IRAND(}) * 1000})}, 10} + 63)., 100 F ROM 
TEMP WHERE (COUNTER + 1) < 999000 ) 


hbLEcT TD, FYEPE, STATE FROM TEMP,; 


INSERT INTO DB2INST1.CARS (ID, TYPE, STATE) 
WITH TEMP (COUNTER, .ID, TYPE, STATE) AS 
( VALUES (0, GENERATE UNIQUE(), 'A', 1) 
UNION ALL 
SELECT 
(OOUNTER F117 
GENERATE UNIQUE (), 
CHR (MOD (INT (RAND() * 1000), 10) + 65) ， 
MOD (INT (RAND() * 1000), 99) + 1 


F ROM 
TEMP 
WHERE 
(COUNTER + 1} < 1000 
) SELECT JB, EEE DTATE FROM TEMP // 


CREATE INDEX DB2INST1 .I TYPE ON DB2INSTL .CARS (TYPE ASC) ALLOW REVERSE SCANS : 

CREATE INDEX DB2INST1 .I STATE ON DB2INSTL1 .CARS (STATE ASC) ALLOW REVERSE 
SCANS, 

COMMIT; 


在 他 们 的 业务 逻辑 中 ,经 党 有 类 似 如 下 的 查询 ， 用 于 选择 型 号 为 A 且 正 处 在 制造 流程 
尚未 完工 的 所 有 汽车 : 


SELECT * FROM CARS WHERE STATE < 100 AND TYPE = "A 


首先 来 分 析 一 下 ， 在 没有 分 布 统计 信息 、 而 只 有 CARS 表 的 基本 统计 信息 及 其 索引 的 
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情况 下 ? 优化 露 选择 的 访 加 计划 是 怎样 的 9 如 氏 ] 1-6 所 示 。 


Total Cost: 3242.63 
OuUEerYy DEedgree: 


1]o00000 1]e+008 
IA%SCA 丰 NN TABLE;: SAMPLE 


EC .3 
456.292 
159.896 


| 
1]eE+Q0e 


INDEX: SAMPLE 
I_TYPE 


图 11-6 ”没有 分 布 统计 信息 时 查询 的 访问 计划 


由 于 优化 器 不 知道 STATE 值 不 是 均匀 分 布 的 ， 因 此 它 决定 使 用 索引 I TYPE。 使 用 这 
个 索引 会 带 来 较 高 的 成 本 ， 因 为 在 访问 CARS 表 之 前 ， 需 要 从 索引 中 读 取 大 约 100 000 个 
RID( 记 录 ID)。 此 外 ， 对 于 查询 返回 行 数 的 假设 也 是 错误 的 。 因 为 优化 器 认为 所 有 制造 步 
又 (从 1 一 100) 都 有 相同 的 频率 ， 所 以 它 无 法 预知 谓词 “STATE < 100” 将 过 滤 掉 大 量 有 价 
值 的 行 。 但 是 您 知道 ， 事 实 是 在 所 有 1 000 000 辆 汽车 中 ， 只 有 1 000 辆 汽车 正 处 于 生成 流 
程 中 。 


在 没有 分 布 统计 信息 的 情况 下 ,执行 该 查询 时 , 动态 SQL 的 一 个 快照 返回 以 下 监视 器 
值 (假定 所 需 的 监视 器 开关 已 激活 ): 


Number of executions = 1 
Number of complilations = 1 
Worst preparation time (ms) = 
Best preparation time (ms) = 9 
Internal rews deleted = 
Internal rows inserted 二 
Rows read = 99336 
Internal rows updated = 
RowS written = 0 
Salemnkb Sorts = 
Statement sort overflows 三 
Total sort 七 Ime = 0 
Buffer pool data logical reads = 8701 
Buffer pool data physical reads = 8131 
Buffer pool temporary data logical reads = 0 


47 1 


DB2 数据 库 性 能 调整 和 优化 (第 3 版 ) 


Buffer pool temporary data physical reads = 0 

Buffer pool index logical reads = 165 

Buffer pool index physical reads = 155 

Buffer pool temporary index logical reads = 0 

Buffer pool temporary index physical reads = 0 

Total execution 七 Ime (sec.ms) = 0.530903 

Total user cpu time (sec.ms) = 0.280403 

Total system cpu time (sec.ms) = 0 30332 

EaLemenl Text = SEEECE ID, TYEE,. STATE FROM 
SAMPLE .CARS WHERE STATE < L090 AND TYPE = "A 


在 此 ， 我 们 不 会 进一步 分 析 这 些 值 ， 但 是 请 记 住 它们 ， 以 便 与 有 分 布 统计 信息 时 使 用 
相同 得 询 得 到 的 监视 邢 值 相 比较 。 

接 下 来 ， 为 CARS 表 生 成 分 布 统计 信息 ， 并 上 再 次 执行 得 询 。 此 时 ， 优 化 器 选择 了 多 
11-7 所 示 的 访问 计划 。 


Total Cost: 203. 809 
QuUery Degree: 0 


ROWS 
Fy 


RIDSCN TABLE: SAMPLE 
六 RS 


| 
le+006 
INDEX: SAMPLE 
I_STATE 


图 11-7 有 分 布 统 计 信 息 时 查询 的 访问 计划 


这 个 访问 计划 的 成 本 明显 低 于 没有 分 布 统计 信息 时 的 成 本 : 前 者 为 203.809， 而 后 者 
为 3242.63。 这 是 因为 优化 器 现在 知道 ， 谓 词 “STATE<100” 有 较 高 的 过 滤 因 子 ， 因 而 只 会 
返回 大 约 1 000 辆 正 处 于 生产 流程 中 尚未 完工 的 汽车 。 因 此 在 这 种 情况 下 ，CARS 表 不 是 
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使 用 索引 I TYPE 来 访问 的 ， 而 是 使 用 索引 I STATE 来 访问 的 。 此 外 ， 现 在 可 以 正确 地 估 
计 结 果 集 中 的 总 行 数 。 现 有 1 000 辆 汽车 尚未 完工 ， 不 同 的 型 号 出 现 频 率 相 同 。 故 结果 集 
中 包含 大 约 100 行 。 

有 分 布 统计 信息 时 的 访问 计划 要 优 于 没有 分 布 统 计 信 息 时 的 访问 计划 。 但 是 ， 这 是 盏 
会 影 啊 但 询 的 执行 时 间 ? 以 下 是 有 分 布 统计 信息 时 得 询 的 监视 堪 数 据 快 照 : 


Number of executions = 1 

Number of compilations = 1 

Worst preparation time (ms) 9 

Best preparation time (ms) = 

internal rows deleted 计 

Internal rows inserted 一 

Rows read = 1000 

Internal rows updated = 0 

Rows written = 0 

staltement Sorts 二 

Statement sort overflows = 0 

Total sort 七 Ime = 5 

Buffer pool data logical reads = 11 

Buffer pool data physical reads = 10 

Buffer pool temporary data logical reads = 0 

Buffer pool temporary data physical reads = 0 

Buffer pool index logical reads = 12 

Buffer pool index physical reads = 9 

Buffer pool temporary index loglcal reads = 0 

Buffer pool temporary index physical reads = 0 

Total execution 七 Ime (sec.ms) = 0.014597 

Total user cpu time (sec.ms) = 0.000000 

Total system cpu time (sec.ms) = .0L0014 

Statement text -BEEECT TD TYPEE, STATE FROM 
SAMPLE .CARS WHERE STATE < 100 AND TYPE 三 "A 


表 11-3 比较 了 有 分 布 统计 信息 和 没有 分 布 统计 信息 这 丙种 不 同情 况 下 的 快照 星 视 占 值 。 


表 11-3 比较 快照 监视 器 值 
快 照 什 有 分 布 统计 信息 
Rows read 1 000 
Butfer pool data logical reads 11 


Butter pool Index logical reads 165 12 


Total execution time (sec.ms) 0.530903 0.0145S97 
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可 以 看 到 ， 在 有 分 布 统计 信息 的 情况 下 ，DB2 执行 查询 时 需要 计算 的 行 数 更 少 。 这 对 
于 CPU 成 本 和 LO 成 本 都 有 积极 的 影响 。 最 重要 的 是 总 执行 成 本 ， 因 为 总 执行 成 本 关系 到 
应 用 程序 的 啊 应 时 间 。 在 具有 分 布 统计 信息 的 情况 下 ， 这 个 时 间 是 0.014597 秒 ， 而 在 没有 
分 布 统计 信息 的 情况 下 ， 这 个 时 间 是 0.530903 秒 ， 相 差 36 倍 之 多 。 

在 我 们 的 示例 中 ， 两 种 情况 下 的 执行 时 间 分 别 为 0.014597 秒 和 0.530903 秒 ， 这 个 天 


中 还 不 够 明显 ， 因 为 这 两 个 值 只 是 次 秒 级 的 。 然 而 ， 这 样 的 差距 不 应 被 忽略 ， 因 为 如 果 这 
样 的 合 询 次 数 非常 多 、 非 沼 频 宫 ， 那 么 这 种 提高 对 性 能 影响 也 是 非常 明显 的 。 同 时 ， 如 时 


要 执行 更 复杂 的 查询 ， 或 者 要 连续 执行 多 个 查询 ， 那 么 执行 时 间 的 差距 就 不 是 次 秒 级 的 ， 
而 是 以 秒 甚 至 分 钟 来 计算 的 。 


分 布 统计 信息 的 生成 

如 前 所 述 ， 在 使 用 RUNSTATS 命令 生成 统计 信息 时 ， 并 不 是 总 会 收集 分 布 统计 信息 。 
这 是 有 意义 的 ， 因 为 仅 在 存在 很 多 重复 值 或 者 数据 分 布 不 均匀 的 情况 下 ， 分 布 统计 信息 才 
重要 。 而 在 其 他 情况 下 ， 分 布 统计 信息 并 不 能 带 来 多 大 的 好 处 。 

下 面 的 RUNSTATS 命令 只 收集 CARS 表 ( 在 模式 SAMPLE 中 ) 和 相应 索引 的 基本 统计 
信息 : 


RUNSTATS ON TABLE SAMPLE .CARS AND INDEXES ALL 


此 外 , 如 果 需 要 收集 CARS 表 中 所 有 列 的 分 布 统计 信息 (频率 统计 信息 和 分 位 数 统计 信 
县 )， 那 么 可 以 执行 以 下 命令 : 


RUNSTATS ON TABLE =AMETE .CARS WITH DISTRIBUTION AND INDEAXAES ALL 


成 分 布 统计 信息 意味 着 给 DB2 市 来 额外 、 可 观 的 开销 ， 从 而 影响 RUNSTATS 命令 
Wan 所 以 ， 应 该 只 为 那些 需要 分 布 统计 信息 的 列 生 成 分 布 统计 信息 : 


RUNSTATS ON TABLE SAMPLE.CARS WITH DISTRIBUTION ON COLUMNS (TYPE, STATE) 
AND INDEXES ALL 


应 为 满足 以 下 条 件 的 列 收集 分 布 统计 信息 : 
间 人 姑 )， 或 者 该 列 的 值 分 布 不 均匀， 即 它 们 在 茶 些 局 
部 是 聚合 的 (分 位 数 统计 信息 )。 
e 检 得 等 于 或 不 等 于 谓词 中 使 用 到 该 列 (频率 统计 信息 )， 或 者 检查 小 于 (小 于 等 于 )、 
大 于 (大 于 等 于 ) 或 介 于 两 个 值 之 间 的 谓词 中 使 用 到 该 列 (分 位 数 统计 信息 )。 

对 于 频率 统计 信息 ， 重 要 的 是 定义 好 收集 多 少 个 值 的 重复 数 。 如 采 为 一 个 列 中 的 所 有 
值 收集 频率 统计 信息 ， 那 么 成 本 就 太 高 了 。 如 果 在 执行 RUNSTATS 时 没有 显 式 定义 数量 ， 
那么 DB2 将 使 用 由 数据 库 参 数 num freqvalues 提供 的 默认 数量 。 由 于 NUM 
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FREQVALUES 的 默认 全 为 10，DB2 将 为 列 中 出 现 频 紊 最 高 的 10 个 值 收集 重复 次 数 ， 这 
里 假定 RUNSTATS 是 在 没有 显 式 定义 数量 , 并 且 数 据 库 参数 num freqvalues 没有 被 修改 的 
情况 下 执行 的 。 

与 频率 统计 信息 类 似 ， 也 必须 为 分 位 数 统计 信息 定义 数量 以 保证 精确 性 。 分 位 数 统计 
信息 定义 应 该 使 用 多 少 “ 上 度量 值 ”(measurement)。 列 中 的 值 被 认为 是 按 升序 排列 的 ， 并 且 
有 正则 的 行 间 隅 ， 相 应 的 值 是 确定 的 。 使 用 的 上 度量 值 越 多 ， 优 化 器 对 于 检查 范围 (<、>、 
<=、>=、BETWEEN) 谓 词 的 过 滤 因 子 的 估计 就 越 准确 。 如 果 在 执行 RUNSTATS 时 没有 明 
傅 指 定 什 ， 那 么 DB2 将 使 用 由 数据 库 参 数 num quantiles 提供 的 默认 数量 。NUM _ 
QUANTILES 的 默认 值 是 20， 也 就 是 说 使 用 20 个 度量 值 。 这 已 经 是 较 好 的 值 ， 因 为 可 以 
保证 优化 器 在 使 用 分 位 数 统计 信息 的 情况 下 对 确定 过 滤 因 子 的 估计 误差 最 大 只 有 $%。 

如 果 数 据 库 配 置 db cfg 不 能 提供 num freqvalues 和 num quantiles 的 值 , 那么 可 以 在 执 
行 RUNSTATS 时 显 式 定义 : 

RUNSTATS ON TABLE SAMPLE.CARS WIIH DISTRIBUTION ON COLUMNS (TYPE 


num freqvalues 10 num quantiles 20, state num freqvalues 15 num quantiles 30) 
AND INDEXES ALL 


如 何 检 查 是 否 存 在 分 布 统计 信息 
为 检 僵 和 个 表 的 分 布 统 计 信 息 是 否 已 收集 ， 可 以 合 看 分 类 视图 SYSCAT.COLDIST 的 
内 容 : 


SELECT * FROM SYSCAT .COLDIST WHERE TABSCHEMA = “DB2INST1" AND TABNAME = CARS- 


视图 SYSCAT.COLDIST 结构 如 表 11-4 所 示 。 


表 11-4 SYSCAT.COLDIST 视图 的 结构 


列 名 数据 类 型 是 否 可 以 为 空 描 述 

TABNAME 本 条 目 对 应 的 表 的 名 条 

COLNAME 本 条 目 对 应 的 列 的 名 各 

TYPE CHAR(]) 不 可 以 F = Frequency( 最 大 频率 ) 
Q = 分 位 数值 

SEQNO SMALLINT 不 可 以 如 果 TYPE=F, 那么 该 列 中 的 N 表示 第 NN 频繁 的 值 
如 果 TYPE =Q, 那么 该 列 中 的 N 表示 第 N 个 分 位 
数值 


COLVALUE 数据 值 ， 形 式 为 字符 字面 值 或 是 NULL 但 
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( 续 表 ) 
列 | 守 数据 类 型 是 否 可 以 为 空 拍 还 
VALCOUNT 如 果 TYPE=F, 那 么 VALCOUNT 是 COLVALUE 
出 现在 该 列 中 的 次 数 
如 果 TYPE =Q， 那 么 VALCOUNT 是 其 值 小 于 或 
等 于 COLVALUE 的 行 的 数量 


DISTCOUNT BIGINT 可 以 如 果 TYPE =Q, 那么 该 列 记 录 小 于 或 等 于 COLVALUE 
的 不 同人 的 数量 (如 条 没有 ， 那 么 为 NULD) 


仅 在 收集 了 表 中 至 少 一 个 列 的 分 布 统 计 信 息 时 ，SYSCAT.COLDIST 才 会 包含 关于 该 
表 的 条 目 。 如 果 在 没有 WITH DISTRIBUTION 的 情况 下 再 次 执行 RUNSTATS， 那 么 
SYSCAT.COLDIST 中 与 该 表 对 应 的 条 目 将 被 删除 。 

关于 分 布 统计 信息 的 详细 描述 ， 请 参见 “第 8 章 : 统计 信息 更 新 与 碎片 整理 ”。 


5. 案例 总 结 


J = 


在 这 个 案例 中 ， 硬 件 存 储 IO 放 计 、 操 作 系 统 相 关 配 置 参 数 、 数 据 库 配 置 参 数 等 都 没 
有 问题 ， 而 且 SQL 语句 相对 比较 简单 ， 没 有 什么 可 以 优化 的 余地 : 同时 在 表 上 也 有 相应 的 
索引 。 乍 一 看 ， 好 像 没 有 什么 可 以 调整 的 ， 只 能 添加 硬件 资源 了 。 但 是 通过 我 们 对 客 忆 业 
务 逆 辑 的 分 析 ， 结 合 数 据 库 内 相关 表 的 情况 ， 对 业务 相关 的 表 做 了 分 布 统计 信 息 ， 从 市 使 
性 能 得 到 了 极 大 提高 ， 所 以 大 家 需要 深入 理解 DB2 中 的 每 个 概念 ， 这样 才 能 结合 应 用 运用 
地 得 心 应 手 。 


11.4 ” 调 优 案例 4: 菏 农 信 社 批量 代 收 电费 批 处 理 慢 调 优 案 例 
1. 案例 简介 


某 农 信 社 批量 代 收 电费 应 用 ， 该 应 用 每 天 晚上 从 供电 公司 FTP 批量 文件 过 来 ， 有 35 万 
条 记录 。 处 理 过 程 是 这 样 : 每 证 出 批量 文件 的 每 一 行 ， 写 入 表 batdtl， 根 据 表 batdtl 的 数据 
生成 后 人 台 批 量 文 件 ， 后 台 处 理 完 成 后 返回 结果 ， 然 后 读 后 台 结果 文件 ， 更 新 表 batdtl 中 相 
应 记录 的 状态 。 

2. 问题 描述 


问题 束 出 在 更 新 表 batdtl 相应 记录 的 状态 这 里 ,35 万 条 记录 做 了 十 儿 个 小 时 都 没 做 完 。 
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3. 性 能 优化 步 又 

(1) 建立 性 能 调整 目标 : 响应 时 间 能 够 满足 批 处 理 要 求 。 

(2) 监控 数据 库 运 行 ， 检 查 DB2 数据 库 的 参数 设置 是 否 合理 。 

(3) 分 析 执 行 计划 ， 调 整 SQL 和 索引 。 

4. 性 能 问题 的 定位 、 优 化 措施 和 建议 

在 这 个 案例 中 ， 引 起 性 能 慢 的 SQL 语句 已 经 通过 业务 逻辑 发 现 ， 使 用 巾 入 SQL 的 编 


程 语句]: 


EXEC SQL 

DUPEDATE Bod TOE SiaG Ter SCaL Tiao En Tosterr oterr 
hostmsg=:hostm 

WHERE bat no=:bat no AND Pay 3eq=:3eqnor 


首先 执行 下 列 SQL 语句 ， 和 三 看 该 表 和 索引 的 统计 信息 是 个 为 最 新 : 


db2 "Select stats 七 Ime from syscat.tables where tabname='BATDTL"'™" 
(DeCE state Cm Tirom svcat tdexzes where tabname BATDOIE 


经 过 检 俘 ， 发 现 表 和 索引 的 统计 信息 是 最 新 的 。 
执行 : 
(dbzexpltn Phranch dq UPDATE DatdELl SET TRE SII -TEE SIE flag TiNAS. 


hosterr=:hosterr, hostmsg=:hostm WHERE bat no=:bat no AND pay Segq=:Segqno ”一 
sqlplan.txt 


* Ee 
) 土 忆 : 


读者 在 自己 的 系统 上 运行 时 ， 注 意 把 宿主 变量 赫 代 成 真实 的 值 。 


查看 该 SQL 语句 的 执行 计划 。 经 过 查看 ,发 现 该 表 的 bat no 和 pay seq 列 有 两 个 单列 
索引 。SQL 语句 虽然 也 走 索 引 扫 描 了 ， 但 是 走 这 种 索引 扫描 Index ANDing 肯定 不 是 最 优 
的 。 执 行 计划 如 下 所 示 : 


QQ 
Isolation Level = Cursor Stability 

Blocking = Block Unamb1guous Cursors 

Query Optijmization Class = 5 


SQE Path ="SYSIBM", "SYSFUN", "PBRANCH" "SYSPROC"”, SYSIBMADM", 
Statement: 
pdate pbranch.. DatbdtEl sel rec stat = 00 fiag= 1 hosterr=" AAAAAAA 
where bat no= 02100223T4 and pay seq="1110023846000000 
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Section Code Page = 1386 

pstimated Cost = 0.225233 

Estimated Cardinality = 0.023810 

Index ANDing 

optimizer Estimate of Set Size: 1 

Index ANDInd Bitmap Bulld Using Row IDs 
Access Table Name = PBRANCH.BATDTL ID = 2,6 
Index Scan: Name = PBRANCH.BATDTL IND2 ID = 2 
| Regular Index (Not Clustered) 

| Index Columns.: 

| | 1: BAT NO (Ascending) 
#Columns = 0 

#Key Columns = 1 

| Start Key: Inclusilive Value 

| 1 1 1: '0210022314' 

| Stop Key: Inclusive Value 

| 1 1 1: "0210022314' 

Index-Only Access 

Index Prefetch: None 

Isolation Level: Uncommitted Read 
Lock Intents 

| Table: Intent None 

| Row : None 


| Index AND1ing Bitmap Probe Using Row IDs 

Access Table Name = PBRANCH.BATDTL ID = 2,6 

| Index Scan: Name = PBRANCH.BATDTL INDL ID = 3 
| | Regular Index (Not Clustered) 
| | Index Columns.: 

| | | 1: PAY SEQ (Ascending) 
| #Columns = 0 

| #Kéy Columns = 1 

| | Start Key: Inclusilve Value 
| | | 1 1: "1110023846000000' 
| | Stop Key: Inclusive Value 
| | 1 1 1: "1110023846000000 7! 

| Index-Only Access 

| Index Prefetch: None 

| Isolation Level: Uncommitteqd Read 
| Lock Intents 

| | Table: Intent None 

| | Row : None 
Insert Into Sorted Temp Table ID = tl 
| #Columns = 1 
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| #5Sort Key Columns = 1 

| | Key 1: (Ascending) 

| Sortheap Allocation ParameteTrs : 
| | #Rows = 1.000000 


| Row Width = 20 
Piped 


Duplicate Elimination 
List Prefetch Preparation 
Access Table Name = PBRANCH.BATDTL ID = 2,6 
| 手 Columns = 12 
| Avoid Locking Committed Data 
| Evaluate Block/Data Predicates Before Locking Committed Row 
| Fetch Using Prefetchedqd List 
| | Prefetceh: 1 Pages 
| Lock Intents 
| | Table: Intent Share 
| | Row : Next Key Share 
| Sargable Predlcate (s) 
| | #Predicates = 2 
| | Return Data to Application 
| | 1 #Columns = 14 
Return Data Completion 
End of section 


利用 : 


db2adv1s —d pbranch -9 "UPDATE batdt1 SET rec stat=:rec stat, flag=:FLAG, 
hosterr—:hosterr, hostmsg—:hostm WHERE bat no=:bat no AND Pay seq—:3eqno" 


生成 索引 建议 ， 结 果 如 下 : 


execution started at timestamp 2008-10-20-12.05.31.124231 
Recommending indexes... 

total disk space needed for initial set | 1.013] MB 
total disk space constrained to [ 324.569] MB 
Trying variations of the solution set. 


Optimization finished. 
1 indexes 1n current solution 
[23000.0000] timerons (without recommendat1ions) 
[ 75.0000] timerons (with current solution) 
[99.67%$] improvement 

—— LIST OF RECOMMENDED LNDEAXES 


-— index[1], 1 .013MB 
CREATE INDEX "DB2INST1™."TDX8102011022360000™” ON "PBRANCH "."BATDTL™" 
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BAT NO MSE "PAY SEQ BSGY ALBOW BEVERSE SCANS 。 
COMMIT WORK :> 
RUNSTATS ON TABLE “PBRANCH "."BATDTL™” FOR INDEX 
“BBZINSTL™ “IDX8L07201 7053560000” = 
COMMIT WORK }; 
-一 RECOMMENDED EXISTING INDEXES 


-一 UNUSED EXAISTING INDEXES 


-— DROP INDEX "PRRANCH. “. "BATDTE INDL"; 
= 一 DROP INDEX “PBRANCH. “. "BATDTL, IND2Z™y 


7 solutions were evaluated by the advisor 
DB2 Workload Performance Advilisor tool 1s finished. 


创建 索引 后 ， 这 个 批量 代 收 电费 应 用 的 批 处 理 时 间 从 10 个 多 小 时 减 至 7 分 钟 。 这 是 
一 次 极 佳 的 性 能 扣 局 | 
5. 案例 总 结 


1 = 加 


在 这 个 案例 中 , 造成 批量 代 收 电费 批 处 理 慢 的 主要 原因 是 为 该 SQL 语句 创建 了 不 合理 
的 索引 。 如 果 您 对 创建 索引 没有 把 所 的话 , 有 一 个 比较 偷懒 的 办 法 一 一 利用 db2advis 工具 ， 
它 会 为 SQL 生成 最 合理 的 索引 。 注 意 应 用 前 一 定 确 保 表 和 索引 的 统计 信息 为 最 新 的 。 


11.5 ” 调 优 案例 5: 某 银 行 系统 字段 类 型 定义 错误 导致 SQL 
执行 时 间 变 长 
1. 案例 简介 


革 银 行 系统 在 测试 环境 数据 库 中 执行 某 条 语句 耗 时 非常 短 ， 在 生产 环境 上 线 新 业务 之 
后 发 生 语 名 执行 变 慢 。 


2. 问题 描述 


在 数据 量 不 变 的 前 捉 下 , 在 测试 环境 中 只 需要 儿 秒 钟 就 执行 完 的 SQL 语句 , 在 人 硬件 性 
能 更 强 的 生产 环境 却 需 要 数 十 分 钟 。 


3. 性 能 优化 步 又 
(1) 建立 性 能 调整 目标 : 达到 测试 环境 下 的 执行 速度 。 
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(2) 检查 系统 中 的 所 有 价 件 系统 ， 确 认 便 件 没有 问题 。 
(3) 检查 AIX 内 核 参数 和 DB2 参数 设置 是 否 合 理 。 
(4) trace 该 SQL 语句 ， 友 现 异 各 的 函数 调用 。 

(5) 调整 表 结 构 ， 降 低 执 行 时 间 ， 满 足 性 能 目标 。 


4. 性 能 问题 定位 、 优 化 措施 和 建议 
通过 应 用 日 志 ， 可 以 发 现 出 问题 的 SQL 如 下 : 


select count (]) 
FROM FRP.T40 IAMDEALS TI 
LEFT JOIN FRP.T40 CORPO TW 
ON "TI CEEY JD TW. HOST CUSTE LD 
with ur; 


出 问题 SQL 的 执行 计划 如 下 : 


Access Plan: 
ToOtal Cost: 9.37059e+06 
QUuery Degree: 1 


ROWS 
RETURN 
Ey 
Ce 
I/O 
1 
GRPBY 
bE 
9 371059e106 
492 / 
1.37628e+10 
>NLJOIN 
(93) 
8.55182e+06 


20772 662709 
TBSCAN IXSCAN 
(国有 ( >) 
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224.049 5 5 
2213 A4713.22 
| 
207712 662709 
TABLE: FRP INDEX: FRP 
T40 IAMDEALS P T40 CORPO UN 
Q2 Ol 


通过 查看 上 述 执行 计划 ,看 不 出 什么 太 大 的 问题 ,我们 对 有 问题 的 SQL 做 trace, trace 
出 来 的 结果 如 下 : 


3853 0.002489669 | sglriChar2GraphicWithLen entry [eduid 100151 
eduname db2agentl 

38o04 0 .002490220 | | sqLTrICastC2G entry [eduid 100151 eduname 
db2agent | 

二 和 号 O002490 /9 | | | sqlriLobBufferManager entry [eduid 100151 
eduname db2agentli 

3856 0.002490992 | | | sqlriLobBufferManager exit 

S00 0.002491211 | | 1 sqlnls char2graph entry [eduid 100151 
eduname db2agentli 

38o08 0.002491806 | | 1 | sqlocpcv entry [eduid 100151 eduname 
db2agent | 

3859 0 .002492289 | | | 1 1 sglnlscpcv entry 

3860 0 .002492521 | | | | | sgqglnlscpcv data [probe 2| 

3861 0 .002493272063 | | 1 1 1 sglnlscpcv data [probe 6| 

38062 0.00249318] | | | | | sqglnlscpcv data [probe /j 

3863 0.002494281 | 1 1 | | sglnlscpcv data [probe 11] 

38064 OQ.002494791 | 1 1 1 1 sqglnlscpcv data [probe 13] 

3805 0 .002495285 | | | 1 | | sqlnlsCcodePageConvert entry 

3866 0..002495490 | || 1111 sgqglnlsynicodeConv entry 

3867 0.002496376 | 11 111 1 sqlnlsyunicodeConv exit 

3868 0 .002496582 i111i11 sqlnlscodePageconvert data [probe 193| 

38069 0.002491046 | 1 1 1 1 1 sqglnlscodePageConvert exit 

3810 0.00249 1494 | | 1 | 1 sglnlscpcv data [probe 990| 

3 1 0.002491990 | | | | | sgqglnlscpcv data [probe 999| 

381712 0.002498484 | 1 1 1 1 sglnlscpcv exit 

了 日 13 U-UUZ49868 7 | 1 1 1 sqlocpcv exit 

38 /4 0.002499138 | | | sgqglnls char2graph exit 

38 1715 Jd D02499371 | 1 sqlriCastC2G exit 

3876 0.002499835 | sqlriChar2GraphicWithLen exit 


可 以 看 到 有 很 多 调用 sqlriChar2GraphicWithLen 的 方法 ， 所 以 怀疑 是 在 做 VARGRAPHIC 
的 转型 操作 ， 进 一 步 检 枉 表 结 来 后 ， 友 现 T40_IAMDEALS 表 的 CPTY_ID 字段 被 错误 地 
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ee VARGRAPHIC， 导 致 在 连接 的 时 候 需 要 做 大 量 的 转型 操作 ， 降 低 了 执行 速度 ， 同 
十 影响 执行 计划 的 生成 。 
解决 方法 是 让 开发 人 员 将 VARGRPAHIC 改 为 VARCHAR， 这 样 就 避免 了 每 次 对 比 都 
进行 转型 操作 ， 重 建 表 并 且 重 新 导入 数据 后 该 SQL 的 执行 时 间 明 显 缩短 。 


5. 案例 总 结 


DB2 提供 了 很 强大 的 stack 和 trace 功能 ， 可 以 让 我 们 详细 了 解 到 DB2 的 函数 调用 层 
de 虽然 我 们 不 是 DB2 的 开发 人 员 ， 但 是 有 些 很 难 一 眼看 出 来 的 SQL 性 能 问 
， 人 仍然 可 以 通过 stack 或 trace 出 来 的 图 数 名 和 时 间 ， 及 现 一 坚 蛛 丝 己 迹 。 


11.6” 调 优 案例 6: 未 银行 客户 回 单 系统 CPU 使 用 率 高 


1. 案例 简介 


客户 回 单 系统 负责 全 行 所 有 交易 的 回 单 生 成 和 回 单打 印 功 能 和 
Web Service 接口 两 种 访问 方式 ， 客 户 可 以 通过 手机 银行 、 网 络 银行 柜台 等 多 渠道 进行 回 
单 的 查询 和 打印 ， 每 天 的 打印 量 在 百 万 笔 ， 属 于 白天 比较 繁忙 的 系统 。 


2. 问题 描述 


该 系统 在 某 雇 应 用 有 版 本 变更 后 ， 在 第 二 天 日 天 业务 局 峰 时 段 ， 数 据 库 的 CPU 使 用 这 升 融 


天 90% 以上， 正常 变 更 前 ， 数据库 的 CPU 使 用 率 只 有 20% 左 右 ; 前 台 业 务 啊 应 时 间 明 显 加 长 ， 
如 图 11-8 所 示 。 


图 11-8 ”topas 的 执行 结 末 
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3. 性 能 优化 步骤 

(1) 建立 性 能 调整 月 标 : CPU 使 用 率 下 降 到 30% 以 下 ， 啊 应 时 间 能 够 满足 客户 要 求 。 

(2) 确定 造成 CPU 使 用 率 高 的 进程 。 

(3) 检查 DB2 的 活动 session 数 和 每 秒 扫描 最 多 的 表 。 

(4) 优化 或 干预 SQL 语句 ， 协 助 软件 开发 商 优 化 应 用 程序 。 

4. 性 能 问题 的 定位 、 优 化 措施 和 建议 

出 现 这 种 问题 后 ， 我 们 的 第 一 反应 就 是 查看 每 个 进程 的 CPU 占用 率 ， 通 过 topas， 可 
以 看 到 db2sysc 这 个 数据 库 实例 进程 占用 了 99.7% 的 CPU。 进 而 我 们 切换 到 实例 用 户 ， 查 
看 db2top， 看 db2 的 具体 执行 情况 。 按 d 看 数据 库 的 整体 情况 ，ActSess 代表 当前 正在 执 
行 的 SQL 数量 ，77 个 正在 执行 的 SQL， 已 经 明显 高 于 平均 数 了 ， 如 图 11-9 所 示 。 再 按 D， 
看 具体 每 个 连接 的 执行 情况 , 也 可 见 都 处 于 UOW Executing 状态 ， 如 图 11-10 所 示 。 再 按 T， 
看 每 个 表 的 读 写 情况 ， 可 见 BILL PRINT _ CORP 表 每 秒 的 行 读数 非常 高 ， 如 网 11-11 所 示 。 


图 11-9 db2top 的 执行 结果 


图 11-10 db2top 按 D 的 执行 结果 
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图 11-11 db2top 按 工 的 执行 结果 


看 到 这 种 情况 ， 束 要 分 析 是 否 有 执行 了 表 扫 描 的 SQL 语句， 那么 我 们 立刻 抓 取 所 有 
agent 的 snapshot: 


db2 get snapshot for applications on brmsdb 


但 看 行 谈 较 多 的 SQL， 发 现 图 11-12 所 示 SQL 的 行 读 较 多 。 


图 11-12 行 读 较 多 的 SQL 


select 
去 
from 
(Sselect 
rownumber() over(order by 
bl111fLowco0 .SA ACCT NO, 
BillEIOWECSOD -SA TX DLT. 
billflowco0 .INNER NO) as rownumber ， 
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bl111flowco0 -INNER NO as col 0 0 ， 


bl111pPFrIntcl -IS PATCH as col 46 0 ， 


CaSe 
when billprintcl] .PRINT CNTS 1s null 

then 0 

else billprintcl .PRINT CNTS end as col 47 0 
from 


BILL FLOW CORP billflowco0 
lefE Gter jon BIEE PRINT CORP Biliprintel 
on billflowco0 .INNER NO=blillprintcl .INNER NO 

where 
1=1] and 
(billflowco0 .SA ACCT NO~='56567676171671" or 
pillflowco0 .SA ACCT NO='S6786543434" OF 
billflowco0 .SA ACCT NO='12346141" Or 
billflowco0 .SA ACCT NO="7185445633]1" or 
billflowco0 .SA ACCT NO= 456434561718" or 
billflowco0 .SA ACCT NO='7897165678644' or 
billflowce0 .SA ACCT NO="2345645323456" Or 
billflowceo0 .SA ACCT NO="S67156154433355' OF 
biTlIFfIGwCo0 .SA ACCT NO—"12343234543" GF 
blilljflowco0 .SA ACCT NO='687978473234"' or 
billiflowco0 .SA ACCT NO="3857643245671" Or 
Bilifliewceo0 二 SA ACCT MNO"37957396983' Or 
billflowco0 .SA ACCT NO= 48596843245°" or 
billflowco0 .SA ACCT NO='284896059322") and 
billflowco0 .ACCT TYP="2" and 
billflowco0 .PRINT CNTS=0 and 
billjflowco0 .IS PATCH=" : 

order by 
billflowco0 .SA ACCT NO, 
billflowco0 -SA TX DT., 
bl111flowco0 .INNER NO 

) as temp 

where 
rownumber <= > 


BILL FLOW_CORP 表 是 回 单 的 流水 主 表 , 有 4 亿 条 数据 , 表 上 有 INNER NO 的 索引 。 
BILL PRINT CORP 表 是 回 单 的 附属 表 ， 记 录 每 条 回 单 的 打印 次 数 ， 有 1 亿 条 数据 ， 也 以 
INNER NO 作为 案 引 。 理论 上 , 如 果 先 通过 账号 在 回 单 流水 主 表 里 过 滤 出 少 部 分 流水 数据 ， 
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然后 再 通过 索引 关联 打印 次 数 ， 也 不 会 出 现 CPU 高 的 问题 ， 那 么 我 们 就 用 db2exfimt 命令 
来 查看 这 个 SQL 的 执行 计划 ， 发 现 DB2 对 打印 次 数 表 错误 地 选择 了 表 扫 摘 的 方式 ， 就 是 
这 种 错误 的 执行 计划 造成 了 该 SQL 执行 速度 低下 、CPU 耗 用 高 ， 参 见 图 11-13。 


[| 
HSJOIN< 
(各 
i03441 
ST145.6 
ee ne \ 
1.02456e+08 下 县 和 站 -二 
TBSCAN FETCH 
加 ( 8) 
B81829.4 15614.9 
53308 3837.58 
| 和 \ 
1 .0245e+08 仿 受 引 有 -二 4.16821iet+08 
DP—TABLE: BILL RIDSCN DP—TABLE: BILL 
BILL PRINT CORP 【 9) BILDL FLOW CORP 
品 了 12711.8 A 
1880 


图 11-13 优化 前 的 执行 计划 


找到 问题 后 ， 我 们 需要 分 析 一 下 问题 产生 的 原因 。 首 先 看 统计 分 析 ， 都 是 最 新 的 ， 没 
有 什么 问题 ， 因 此 出 问题 的 原因 很 有 可 能 是 DB2 计算 了 一 个 错误 的 成 本 ， 因 此 我 们 采用 
DB2 的 语句 级 的 OPTGUIDELINES 来 干预 执行 计划 。 在 该 SQL 语句 的 后 面 增加 如 下 优化 
方案 ， 要 求 DB2 对 该 SQL 只 使 用 最 小 查询 优化 ， 强 制 该 SQL 使 用 走 索 引 的 NLJOIN。 

/*<OPTGUIDELINES> <ORYOPT VALUE="0"/»> </OPTGUIDELINESS>*)/ 

优化 后 的 执行 计划 如 图 11-14 所 示 ， 打 印 次 数 表 通过 索引 和 回 单 流 水 主 表 进行 
NLJOIN。 开 发 更 新 完 代 码 ， 重 新 部 车 生 产后 ， 目 前 日 间 CPU 只 要 20% 不 到 了 ， 并 且 客 户 
的 啊 应 时 间 大 大 降低 。 


39 .5042 
( 6} 
75917.2 
12464.5 
Dr Te re i i i \ 
39.5042 0.25557 
FETCH FETCH 
( 37] 
ie619.8 1499.83 
4632 .59 198.256 
Es ' Ne \ 
EE 4.168621e+09 0 25557 1 .D0245e1+09 
RIDSCN DP-TABLE: BILL DP-TABLE: BILL 
{ 38} BILL FLOW CORDP 1: BILL DRINT CORP 
T2712.7 Qs 1497.89 a7| 


| 
1.0245e+08 
DP-INDEX: BILL 
TDX BILL PRINT CORP 01 
Q7 


图 11-14 优化 后 的 执行 计划 
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5. 案例 总 结 


通过 该 案例 ， 希 望 读者 可 以 了 解 SQL 调 优 的 三 板 径 : 

(1) 看 活动 会 话 的 个 数 和 表 扫 换 最 多 的 表 。 

(2) 找到 表 扫 描 最 多 的 表 对 应 的 SQL 语句 。 

(3) 通过 OPTGUIDELINES 来 干预 执行 计划 。 

有 时 候 ，DB2 优化 器 不 一 定 有 你 想象 的 那么 智能 ， 太 复杂 的 SQL 很 可 能 会 干扰 DB2 
优化 器 的 判断 ， 去 选择 不 应 该 使 用 的 执行 计划 。 这 个 时 候 ， 就 需要 通过 一 些 办 法 来 纠正 
这 种 错误 ， 比 如 : 

(1) 运行 更 细 粒 度 的 统计 分 析 。 

(2) 通过 OPTGUIDELINES 来 强制 修改 执行 计划 。 

所 以 碰 到 这 种 问题 不 要 慨 张 ， 按 照 上 面 的 步骤 做 ， 一 定 能 够 找到 解决 的 办 法 。 


11.7 ” 调 优 案例 7: 某 银行 手机 银行 系统 latch 竞争 导致 
active session 高 、 性 能 慢 问 题 


1. 案例 简介 


手机 银行 系统 是 最 重要 的 渠道 系统 之 一 ， 不 论 白天 还 是 晚上 都 比较 繁忙 ， 查 询 业务 量 


和 办 理 业务 量 一 直 比 较 大 。 某 一 天 突然 出 现 手 机 银行 登录 缓慢 问题 ， 严 重 影响 客户 的 正常 
使 用 。 


2. 问题 描述 


该 系统 在 问题 出 现 之 前 的 一 段 时 间 内 没有 应 用 程序 的 变更 ， 也 没有 数据 库 上 的 变更 ， 
只 是 在 交易 量 上 有 平稳 的 增长 。 问 题 发 生 时 ， 数 据 库 服务 堪 的 CPU 使 用 率 升 高 到 90% 以 
上 ， 活 动 会 话 (active session) 达 到 2000 以 上 ， 其 中 一 部 分 处 于 commit active 状态 ， 同 时 通 
过 db2pd 看 到 有 大 量 的 latch 等 符 。 

3. 性 能 优化 步骤 

与 之 前 的 案例 不 同 ， 这 是 一 个 紧急 的 性 能 问题 ， 需 要 在 很 短 的 时 间 内 解决 ， 因 此 相 比 
之 前 的 案例 多 了 硅 干 应 急 处 理 的 过 程 。 

为 了 尽快 恢复 业务 服务 水 平 , 针对 数据 库 服务 右 CPU 高 和 active session 局 的 现象 , 采 
取 了 重启 DB2 实例 的 措施 ， 但 重启 之 后 发 现 active session 几 分 钟 乙 内 再 次 超过 2000， 问 
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题 没有 解决 。 
重 司 数据 库 实 例 不 生效 ， 只 能 按 部 惑 班 进行 分 机 和 优化 : 
(1) 建立 性 能 调整 目标 : 降低 active session， 降 低 CPU 使 用 率 。 
(2) 分 析 active session 当前 正在 执行 的 任务 和 墙 窟 的 原因 。 
(3) 分 析 latch 的 含义 ， 寻 找 解决 该 latch 的 方法 。 


4. 性 能 问题 的 定位 、 优 化 措施 和 建议 


该 问题 有 友 生 时 ， 数 据 库 监控 系统 第 一 时 间 发 出 了 数据 库 服务 郁 CPU 使 用 率 局 和 active 
session 山 的 告警 。 我 们 马上 通过 topas 确认 了 数据 库 实 例 进 程 db2sysc 占用 了 97% 的 CPU。 
切换 到 实例 用 户 ， 用 db2top， 按 d 查看 数据 库 的 整体 情况 ， 看 到 ActSess 有 2000 多 ,但 
其 他 指标 看 起 来 都 正常， 进一步 按 1( 小 写字 母 )， 看 到 有 大 量 的 session 处 于 commit active 


状态 
i [| 


基于 以 上 人 信息， 怀疑 存储 设备 有 故 际 而 导致 数据 库 commit 操作 无 法 完成 。 但 经 过 确 


认 ， 此 前 存储 链 路 有 过 $ 秒 钟 的 中 断 ， 但 已 经 恢复 下 第。 


进一步 使 用 db2pd -latch 重复 多 次 查看 latch 情况 ， 可 以 看 到 主要 是 由 一 个 名 为 


xhshlatch 的 latch 导致 的 等 待 。 部 分 结果 如 下 : 


Address Holder Walter Filename 
LatchType HoldCount 
OxO0AO0O0020001]1DA22A8 S11 i180 


/view/db2 v97fp10 aix64 s141015/vbs/engn/sqp/inc/sqlpLockIinternal. 


SQLO LT SQLP LHSH xhshlatch 1 
0x0A00020001DA22A8 511780 


/view/db2 v97fp10 alx64 sl141015/vbs/engn/sqp/inc/sqlpLockIinternal. 


SQLO LT SQLP LHSH xhshlatch 1 
0x0A00020001DA22A8 511780 


/view/db2 v97fp10 alx64 sl141015/vbs/engn/sqp/inc/sqlpLockIinternal. 


SQLO LT SQLP LHSH xhshlatch 1 
0x0A00020001DA22A8 511780 


/view/db2 v97fp10 aix64 s141015/vbs/engn/sqp/inc/sqlpLockIinternal. 


SOLO LT SQOLP LHSH xhshlatch 1 
0x0A00020001DA22A8 511780 


/view/db2 v97fp10 alx64 sl141015/vbs/engn/sqp/inc/sqlpLockIinternal. 


SQLO LT SQLP LHSH xhshlatch 1 
0x0A00020001DA22A8 511780 


/view/db2 v97fp10 alx64 sl141015/vbs/engn/sqp/inc/sqlpLockIinternal. 


SQLO LT SQLP LHSH xhshlatch 1 


5 


TO 


69021 
TE 


#01103 
a 


401212 
3 


pe | 
JE 


12209 
Ed 


122024 
a 
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UXUAUUU2UUU0TLDA22AS 311180 621642 
/view/db2 v97fpl10 aix64 sl141015/vbs/engn/sqp/inc/sqlpLockIinternal.h 513 
SQLO LT SQLP LHSH xhshlatch 1 

0x0A00020001DA22A8 311780 102 /10 
/view/db2 v97fp10 aix64 sl141015/vbs/engn/sqp/inc/sqlpLockIinternal.h $313 


SQLIO LT SOLP LHSH xhshlatch 1 


由 于 latch 是 DB2 内 部 的 一 种 机 制 ， 能 看 到 有 latch 等 待 ， 但 还 是 不 知道 DB2 是 在 处 
理 什么 操作 的 过 程 中 过 到 了 latch。 这 时 候 我 们 收集 stack, 使 用 的 命令 是 “db2pd -stack all”。 
通过 分 析 stack， 发 现 主 要 有 两 个 stack: 


Stack 1: 
<StackTrace> 


0x090000002104B258 thread waitlock@glue88]1 + 0x8C 

0x090000002104AFE0 sqloXlatchConflict + OxlE8 

0x0900000020F59820 sqloXlatchCconflictkgljuelABlclone0 + 0x7C 
0x093000000z0F233300 sqlplrm FP8sqeAgent + Ox24 

Ox0900000020F8E518 sqlpxcml FP8sqeAgentPl15SQLXA CALL INEOIL + Ox46C 
0x0900000020F8D49C sqlrrcom dps FP8sqlrr chiT2P15SQLXA CALL INFO + 0x174 
0x0900000020F8AC4C sqlrrcom FP8sqlrr cbiT2 + 0X398 

Ox0900000020F8B500 sqlrr commit FPl4db2UCinterface + 0XDC 


Stack 2: 
<StackTracey 


0x090000002104B258 thread waitlock@glue88]1 + 0X8C 
0x090000002104AFE0 sqloXlatchConflict + OxlE8 
0x090000002104AD3C sqloXlatchConflictkgl]luelAB + 0x78 
0x09000000Z0F3D3C4 sqlplrg FPSsqeBsuEduPl4SsQLP LOCK INEO + UX2 4 
Ox0900000020F85FBC sqglrr get lock FP8sqlrr cbP14SQLP LOCK INFOU1PU] + 
0X100 
0x0900000020F85DD0 
sqlra pkg lock FP8SGlrr CbPUCST2T3T2101TIP1ASOLP LOCK INFO + 
OxB80x0900000020F852C4 
sqlra find pkg FPS8Ssqlrr cbPUcsT2T3T2T31T8PLASQLP LOCK TNFOPP20sgqlra cached 
package + Ux190 
Ox0900000020F84ADC sqlra revalidate pkg FP8sqlrr cb + OxAO 
0x0900000020F84E24 .sgqlra load pkg.idpr.clone.2194 FP8sqlrr cbPUCsT2T3T2b 
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+ Ox190 
UX0U300000020F /DB3C sqlrr sql request pre 
FPlA4db2UCinterfaceUiiPl6é6db2UCprepareInfoPl5db2UCCursorInfo + 0x1678 


从 stack 的 图 数 名 可 以 大 致知 道 ， 第 一 个 stack 是 在 作 commit 操作 时 释放 lock， 对 应 
active session 中 正在 commit active 的 那 部 分 session， 第 二 个 stack 是 在 对 package 进行 加 
锁 操 作 。 

结合 以 上 信息 进行 分 析 ， 手 机 银行 登录 时 需要 在 数据 库 上 执行 一 系列 语句 ， 每 次 操作 
在 数据 库 内 需要 获取 同一 个 package lock， 并 在 commit 时 释放 该 package lock。 因 为 是 同 
一 个 lock， 需 要 操作 同一 个 lock hash table(DB2 内 存 中 的 一 种 内 部 数据 结构 )。latch 
xhshlatch 用 于 顺序 化 多 线程 访问 lock hash table,， 忆 并 发 的 登录 操作 导 禾 对 xhshlatch 的 争 
用 ， 从 而 导致 登录 啊 应 慢 。 

知道 了 问题 的 原因 之 后 ， 开 始 寻找 如 何 避 免 latch 的 方法 。 经 过 与 IBM 技术 文 持 工程 
师 联 系 ， 建 议 将 DB2 APM PERFORMANCE 设 为 ON。 设 置 该 变量 后 重启 数据 库 实例 ， 
问题 暂时 得 以 解决 。 

DB2 知识 中 心 提 到 ,“ 将 DB2 APM PERFORMANCE 设 为 ON， 会 启用 无 包 锁定 方 

式 。 此 方式 允许 全 局 查询 珊 速 缓存 运行 ， 而 不 必 使 用 包 锁 定 ， 这 些 锁 定 是 内 部 系统 锁定 ， 
可 以 保护 高 速 缓存 的 包 条 目 不 会 被 除去 。NO PACKAGE LOCK 方式 可 能 会 使 性 能 有 较 小 
的 提高 ， 但 不 允许 执行 某 些 数据 库 操 作 。 这 些 被 茶 止 的 操作 可 能 包括 : 使 包 无 效 的 操作 、 
使 包 不 起 作用 的 操作 、PRECOMPILE、BIND 和 REBIND。” 

尽 和 党 说 是 “有 较 小 的 提高 ”但 是 在 处 理 该 手机 银行 的 问题 时 , 由 于 去 挥 了 package lock 
机 制 ， 从 而 避免 了 xhshlatch， 所 以 在 该 问题 的 处 理 上 该 参数 发 挥 了 巨大 的 作用 。 同 时 也 提 
到 将 DB2 APM PERFORMANCE 设置 为 ON 有 副作用 ， 即 一 些 与 package 相关 的 操作 无 
法 执行 。 后 来 与 IBM 拉 术 文 持 工程 师 进 一 步 沟 通 , 在 DB2 V10.5 中 该 参数 的 值 有 更 多 的 选 
择 ， 可 以 将 其 设置 为 “16”， 基 本 没有 副作用 。 

事后 ， 在 IBM 网 站 上 找到 J 了 一 篇 technote 一 一 “Slow performance with latch contention 
on SQLO LT SQLP LHSH xhshlatch”， 里 和 耐 正式 描述 了 该 类 型 的 问题 ， 并 旦 提供 了 三 种 
解决 方案 ， 其 中 包括 设置 DB2 APM PERFORMANCE， 这 也 是 在 手机 银行 问题 中 唯一 有 
效 的 方式 。 


5. 案例 总 结 


在 这 个 案例 中 ， 面 对 紧急 性 能 问题 ， 第 一 原则 是 尽快 恢复 数据 库 服务 水 平 。 在 简单 碍 
看 数据 库 情 况 ( 例 如 CPU、active session 等 ) 之 后 ， 可 以 答 试 重 司 数据 库 实 例 。 如 果 时 间 人 允 
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许 ， 在 重 局 之 前 可 以 收集 一 些 相 关 数 据 ， 例 如 application snapshot、lock、latch 等 。 

如 果 午 局 数据 库 实例 依然 没有 解决 问题 , 则 需要 现场 进行 问题 诊断 , 找到 问题 的 根源 ， 
并 有 针对 性 地 采取 措施 。 例 如 在 本 案例 中 ， 通 过 和 丛 看 latch 发 现 是 latch 等 每 问题 ， 进 一 步 
通过 stack 分 析 得 出 是 package lock 相关 对 象 上 latch。 尽 管 latch 是 数据 库 内 部 机 制 ， 无 法 
百 接 控 制 其 行为 ， 但 仍 可 以 通过 对 其 上 层 (package lock) 的 干预 来 避免 latch 的 范 争 。 

另外 两 个 经 验 教训 是 : 一 是 要 多 学 习 和 积累 己 有 的 问题 案例 ,例如 这 次 的 问题 BM 网 
站 上 之 前 已 经 给 出 了 technote， 但 我 们 没有 及 时 采用 ; 二 是 对 于 局 并 友 的 业务 系统 ， 要 有 
限 洲 机制 ， 并 且 从 应 用 程序 层面 到 数据 库 层 面 都 要 有 限 流 机 制 。 需 要 注意 的 是 ， 对 于 该 案 
例 ， 采 用 DB2 WLM 限制 并 发 数 并 不 起 作用 。 


11.8 ” 调 优 学 习 案 例 : 利用 压力 测试 程序 学 习 DB2 调 优 


好 了 ， 到 现在 为 止 ， 您 已 经 看 完 本 书 的 所 有 内 容 ， 有 没有 想 实 际 做 一 下 性 能 调整 呢 ? 

在 下 面 这 个 案例 中 ， 我 们 将 对 前 面 学 习 的 内 容 做 全 面 复习 。 因 为 在 实际 生活 中 ， 我 们 
不 可 能 对 目 己 的 生产 环境 进行 调 优 ， 所 以 本 章 通 过 程序 来 模拟 压力 测试 环境 ， 并 通过 这 个 
环境 让 恋 者 进行 调 优 练习 ， 在 这 个 练习 中 会 用 到 我 们 在 前 面 各 个 章节 中 学 习 的 内 容 。 硕 望 
大 家 能 够 做 好 模拟 环境 ， 仔 细 做 好 这 个 实验 。 

在 这 个 案例 中 , 我 们 将 引导 读者 一 步 步 地 学 习 在 监控 和 调 优 DB2 数据 库 中 对 性 能 影 啊 
最 大 的 配置 参数 ， 影 响 性 能 的 维护 操作 (统计 信息 更 新 、 索 引 创建 等 ) 也 穿插 在 这 个 例子 中 。 
通过 使 用 本 书 提供 的 示例 Java 程序 一 一 “DB2 性 能 测试 程序 ”, 您 可 以 了 解 这 些 实用 技术 ， 
而 且 还 可 以 在 您 自己 的 系统 上 试验 各 种 场景 。 在 这 个 过 程 中 ， 您 可 以 使 用 Java 程序 来 模 
拟 对 数据 库 执行 SQL 的 工作 负载 。 许 多 因素 都 可 以 影响 数据 库 服务 堪 的 性 能 ,但 是 这 个 实 
验 将 关注 如 何 调 优 一 些 重 要 的 DB2 配置 参数 ， 以 及 用 于 捕获 和 修复 “有 普 盆 SQL” 的 步骤 。 


1. 概述 
性 能 是 您 使 用 数据 库 系 统 最 重要 的 问题 之 一 。 有 3 个 主要 因素 影响 系统 性 能 : CPU 使 
用 、LO 利用 和 内 存 使 用 ， 如 图 11-15 所 示 。 


图 11-15 影响 性 能 的 主要 因素 
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提示 : 
此 处 省 去 了 网 络 ， 因 为 在 实际 生产 中 ， 由 于 网 络 引 起 的 性 能 瓶颈 很 少 。 


在 进行 性 能 调 优 时 ,根据 系 统 的 具体 情况 , 监控 CPU、 内存 和 LO 是 否 存 在 性 能 瓶颈 。 
对 数据 库 工 作 负 载 的 理解 对 于 有 效 配 置 数据 库 以 获得 最 优 性 能 也 很 关键。 有 以 下 几 种 
类 型 的 数据 库 工 作 负 载 : 

e 联机 事务 处 理 (Online Transaction Processing，OLTP)， 包 含 许 多 不 同 复杂 性 的 小 型 
事务 。OLTP 事务 包括 select、insert、update 和 delete， 通 币 是 以 秒 级 或 次 秒 级 
(sub-second) 的 速度 完成 的 。 

e 决策 文 持 系 统 (Decision Support System，DSS)， 通 单 是 仅 为 select 的 事务 ， 包 含 访 
问 大 量 数据 的 大 型 会 询 。 
批 处 理 。 
报表 。 
以 上 系统 的 混合 。 

无 论 数 据 库 负载 如 何 , 通用 的 调 优 方法 及 流程 都 是 相同 的 , 只 是 OLTP 和 DSS 工作 负 
载 之 间 存 在 差别 。 这 个 案例 仅仅 说 明 OLTP 环境 中 的 监控 和 调 优 提示 。 

许多 因素 都 可 以 影 啊 数据 库 服 务 占 的 性 能 , 例如 便 件 系统 的 设计 、 数 据 库 对 象 的 设计 、 
数据 存储 虎 的 管理 、 应 用 程序 的 设计 等 等 。 这 个 实验 将 关注 如 何在 一 定 的 工作 负载 下 调 优 
DB2 配置 参数 ， 以 及 用 于 捕获 和 修复 “有 悉 劣 SQL ”的 步 又。 


2. “DB2 性 能 测试 程序 ”和 “TESTDB” 数 据 库 


我 们 提供 了 性 能 示例 ， 这 些 示例 使 用 名 为 TESTDB 的 数据 库 以 及 名 为 “DB2 性 能 测试 
程序 ”的 简单 的 Java 独立 程序 。 创 建 和 填充 TESTDB 数据 库 以 及 运行 “DB2 性 能 测试 程 
序 ” 所 需 的 文件 和 指示 可 以 从 笔者 的 博客 下 载 。 最 多 花费 $ 分 钟 就 可 以 准备 好 该 环 声 。 

出 于 简单 性 的 考虑 , TESTDB 数据 库 只 包含 两 个 表 : ACCOUNT 和 AUDITLOG。“DB2 
性 能 测试 程序 ”是 JDBC 应 用 程序 ， 一 旦 调用 该 程序 ， 就 使 用 type 2 Universal 驱动 程序 并 
建立 到 TESTDB 的 10 次 连接 。 其 接口 极其 简单 。 只 要 指定 测试 的 持续 时 间 并 单 击 “ 运 行 ” 
即 可 。 当 程序 执行 时 ， 将 在 10 次 连接 的 每 一 次 中 用 随机 参数 反复 执行 相同 的 事务 。 当 调 
优 数 据 库 时 ， 已 完成 的 事务 数目 学 段 应 随 着 调 优 的 进行 逐渐 增加 。 这 就 是 您 的 性 能 目标 。 

创建 TESTDB 数据 库 和 ACCOUNT、AUDITLOG 表 的 SQL 如 下 : 


create database testdbl 
connect to testdba@ 
create sequence MYSEQQ 
CREATE TABLE ACCOUNT 
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(ACCT TD LNT NOT NULL, 

NAME, CHAR (20) NOT NULL, 
BRANCH LD INT NOT NULL, 
BALANCE INT NOT NULL, 
ADDRESS CHAR(30) NOT NULL)E@ 


begin atomic 
declare cnt INT default 0， 
while (cnt < 100000) do 
insert into account values ( 
nextval for MYSEOQ, 
“account ” concat char (nextval for MYSEOQ)}), 
celling( (rand()*10)), 
celling( (rand(})}*1000000)), 
‘address" concat char (nextval for MYSEOQ) 
); 
Set Cnt=cnit+1> 
end while; 
ende@ 
CREATE TABLE AUDITLOG 
(ACCT ID INTEGER NOT NULL, 
TELLER ID INT NOT NULL., 
BRANCH ID INT NOT NULL, 
BALANCE INTEGER NOT NULL, 
TRANSID BIGINT NOT NULL)@ 
drop sequence MYSEOQR 
select count (*) from accountea 
select count (*) from auditlog@ 


把 上 述 SQL 存放 到 testdb.sql 文件 中 ， 执 行 “db2 -td@ -vf testdb.sql” 创 建 本 实验 有 所定 
要 的 表 。 

DB2 性 能 测试 程序 发 出 的 事务 包含 下 列 碍 询 ; 

e SELECT NAME, BALANCE FROM ACCOUNT WHERE ACCT ID ==<value> 

® UPDATE ACCOUNT SEI BALANCE=? WHERE ACCT ID=? 

e INSERT INTO AUDITLOG VALUES (?, ?, ?, ?, ?) 

希望 您 边 浏 览 内 容 边 操作 DB2 性 能 测试 程序 (在 测试 环境 中 )。 


3. 建立 性 能 调整 基线 


在 调 优 数 据 库 之 前 ， 您 通常 应 建立 性 能 基线 (baseline)。 对 于 这 个 特定 的 场景 ， 我 们 会 
跟踪 应 用 运行 时 内 存 的 消耗 ， 以 及 未 调 优 时 数据 库 所 完成 的 事务 数目 。 首 先 从 初始 环境 开 
台 ， 执 行 下 列 操 作 : 
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enet el 

(2) 打开 DB2 命令 窗口 ， 然 后 发 出 命令 : db2stop force。 

G) 打开 op 任务 管理 磊 ， 选 择 Performance 选项 卡 。 

(4) 在 DB2 命令 窗口 中 ， 发 出 命令 : db2start。 同 时 ， 碍 看 任务 管理 器 中 的 内 存 使 用 是 
多 少 。 启动 实例 要 消耗 一 些 内 存 ， 但 十 不 多 。 

(5) 在 DB2 命令 窗口 中 ， 发 出 命令 : db2 list application。 您 应 收 到 一 条 消息 表明 
Database System Monitor 未 返回 任何 数据 。 

(6) 通过 执行 文件 “DB2 性 能 测试 程序 .bat” 启 动 “DB2 性 能 测试 程序 ”， 并 查看 任务 
管理 需 中 的 内 存 是 如 何 增加 的 。 正 如 前 面 提 到 的 ，“DB2 性 能 测试 程序 ” 一 日 被 调用 ， 束 
建立 10 次 连接 。 当 对 数据 库 建 立 第 一 次 连接 时 ， 就 分 配 数据 库 内 存 。 此 外 ,每 次 连接 都 与 
一 个 DB2 Ms 该 代理 程序 也 花费 一 些 内 存 成 本 。 

(7) 在 DB2 命令 窗口 中 ， 发 出 命令 : db2 list applications。 现 在 ， 您 将 看 到 java.exe 应 
用 程序 (DB2 性 能 试 程序 ) 到 TESTDB 数据 库 的 10 次 连接 。 

您 的 果 面 将 如 图 11-16 所 示 。 请 保持 该 窗口 布局 。 
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为 了 建立 性 能 基线 ， 运 行 “DB2 性 能 测试 程序 ”10 秒 (5 到 8 次 )， 并 写 下 结果 。 您 将 
注意 到 在 aa 所 完成 事务 的 数目 最 少 ， 而 且 事务 的 数目 将 会 随 看 数据 库 的 调 
优 逐步 有 所 提高 ， 但 ra 这 是 正常 的 。 在 第 一 次 运行 期 间 ， 不 会 将 太 多 信息 
缓存 到 内 存 中 ; 因此 , 第 一 次 运行 付出 的 IO 代价 就 是 将 一 些 数据 页 从 硬盘 读 到 内 存 中 。 
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此 时 ， 我 们 已 经 获得 了 未 调 优 数据 库 时 的 性 能 基线 。 您 现在 应 获取 完整 的 DB2 快照 ; 
然而 ， 我 们 不 会 在 本 节 中 讨论 该 主题 ， 请 读者 参考 “第 3 章 : DB2 性 能 监控 ”。 因 此 ， 这 
时 您 在 疯 谈 完 本 贡 之 后 需要 从 头 开 始 重 复 该 实验 。 

4. DB2 监控 

对 数据 库 系统 的 监控 是 调 优 数 据 库 服 务 器 的 重要 部 分 。 监 控 数 据 的 集合 充当 基线 ， 可 
用 于 比较 当前 和 过 去 的 性 能 。 这 帮助 我 们 更 早 更 快 地 检测 出 性 能 问题 。 监 探 数据 还 有 助 于 
您 理解 数据 库 配 置 参 数 和 应 用 程序 修改 对 性 能 的 影响 ， 并 帮助 我 们 分 析 随 独 系统 负载 的 雯 
长 性 能 趋势 的 发 展 情况 。 

1) 监控 数据 库 服务 器 的 技术 概述 

DB2 提供 了 多 个 工具 ， 可 以 用 于 监控 数据 库 服务 器 的 活动 ， 或 分 析 SQL 语句 如 何 访 
问 数据 ;每 个 工具 都 服务 于 不 同 的 目的 。 表 11-5 列 出 了 不 同 的 监控 工具 。 


表 11-5 DB2 监控 工具 概述 (详细 内 容 参 见 本 书 “ 第 3 章 : DB2 性 能 监控 ”) 
监控 工具 监控 信忠 
快 眼 监控 器 在 特定 时 刻 (获取 快照 的 瞬间 ) 及 时 地 捕获 数据 库 活 动 的 状态 信息 
在 发 生 诸如 语句 执行 、 事 务 完成 ， 或 者 应 用 程序 断 开 连接 之 类 的 特定 数据 事件 时 记录 
数据 。STATEMENT 和 DEADLOCK 事件 监控 器 常用 于 性 能 调 优 实践 
解释 工具 捕获 关于 SQL 语句 的 访问 计划 和 环境 的 信息 ， 即 如 何 执行 单条 SQL 语句 以 访问 数据 
监控 SQL 语句 的 性 能 特点 和 执行 持续 时 间 。 从 平面 (flat) 文 件 或 标准 输入 中 读 取 SQL 
db2batch 语句 ， 动 态 地 准备 和 描述 语句 ， 并 返回 性 能 基准 测试 信息 ， 如 SQL 语句 的 准备 时 间 
(Prepare Time)、 执 行 时 间 (Execute Time) 和 读 取 时 间 (Fetch Time) 等 


事件 监控 器 


本 例 中 ， 我 们 使 用 快照 监控 器 和 SQL 解释 工具 。 


2) 快照 监控 器 
快照 监控 器 在 不 同 的 层次 上 收集 信息 ， 如 表 11-6 所 示 。 


表 11-6 快照 监控 器 的 层次 


屋 次 所 捕获 的 信息 
数据 库 管 理 器 捕获 活动 数据 库 管理 器 实例 的 统计 信息 
数据 库 为 当前 数据 库 分 区 上 的 所 有 活动 数据 库 提供 通用 的 统计 信息 
应 用 程序 提供 连接 到 当前 数据 库 分 区 上 数据 库 的 所 有 活动 应 用 程序 的 有 关 信 息 
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在 每 个 数据 库 中 ， 快 照 监控 器 基于 表 11-7 所 示 的 功能 组 层次 收集 信息 。 


表 11-7 快照 的 功能 组 层次 


功能 组 层次 所 捕获 的 信息 
缓冲 池 活 动 读 写 次 数 以 及 所 花 时 间 
锁 锁定 的 数目 ， 死 锁 的 次 数 
排序 所 使 用 的 堆 的 数目 ， 溢 出， 排序 性 能 
SQL 语句 启动 时 间 ， 停 止 时 间 ， 语 句 标识 
表 活 动 测量 活动 ( 行 读 ， 行 写 ) 
工作 单元 开始 时 间 ， 结 束 时 间 ， 完 成 状态 


虽然 默认 情况 下 只 为 表 11-7 所 示 的 每 个 功能 组 层次 收集 一 些 基本 信息 ， 但 也 可 以 通 
dpe ethno srs pisteg 因为 监控 包含 了 开销 ， 所 
以 你 应 该 只 打开 在 监控 任务 中 最 要 紧 的 那个 监控 器 开关 。 男 一 方面 ， 如 果 您 使 用 的 是 测试 
系统 ， 我 们 就 建议 您 在 调 优 系统 时 打开 所 有 的 aide 

通过 分 别 使 用 UPDATE DBM CFG 或 UPDATE MONITOR SWITCHES 命令 , 在 实例 
下 程序 层 打 开 或 关闭 监控 喜 开 关 。 当 在 应 用 程序 层 打 开 监 控 右 开关 时 ， 如 DB2 命令 窗 

， 该 监控 右 就 将 仅仅 应 用 于 特定 会 话 。 例 如 ， 为 了 在 应 用 程序 层 打 开 BUFFERPOOL、 
SORT 和 STATEMENT 的 监控 器 开关 ， 允 要 从 DB2 命令 窗口 友 出 下 列 命 令 : 


db2 update monitor switches using BUFFERPOOL ON SORT ON STATEMENT ON 


因为 您 将 在 测试 系统 中 使 用 DB2 人 性 能 测试 程序 ， 所 以 出 于 简单 性 的 考虑 (不 必 跟 踊 哪 
个 会 话 打 开 了 监控 器 ), 就 通过 从 DB2 命令 窗口 发 出 下 列 命令 在 实例 层 打 开 所 有 的 监控 器 ， 
如 下 所 示 ( 默 认 情 况 下 ，TIMESTAMP 和 HEALTH MONITOR 的 开关 为 ON): 


C:\> db2 update dbm cfg using DFT MON BUFPOOL ON 
C:\> db2 update dbm cfg using DFT MON LOCK ON 
C:\> db2 update dbm cfg using DFT MON SORT ON 
C:\> db2 update dbm cfqg using DFT MON STMT ON 
C:\> db2 update dbm cfg using DFT MON TABLE ON 
C:N> db2 update dbm cfq using DET MON TIMESTAMP ON 
C:\> db2 update dbm cfqg using DFT MON UOW ON 
C:\> db2 update dbm cfg using HEALTH MON ON 


您 或 许 还 需要 增加 监控 右 的 堆 大 小 ， 因 为 这 是 用 于 存储 快照 监控 费 信 息 的 内 和 存 区 域 。 
如 果 设 置 太 小 ， 信息 会 被 快速 复 兰 反 。 使 用 下 列 命令 修改 该 参数 : 
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db2 Update dbm cfg using MON HEAP Sz 1024 


了 aoc 以 便 修 改 生 效 。 


db2 get monitor switches 


该 命令 的 输出 如 下 所 示 : 


监视 器 记录 开关 
数据 库 分 区 号 0 的 开关 列表 
缓冲 池 活 动 信 息 (BUFFERPOOL) = ON 2008-10-24 09:20:37.560724 
锁定 信息 (LOCEY = GN 2009- 10-24 119.20:37.560724 
排序 信息 (SORT) = ON 2008-10-24 09:20:37.560724 
SQL 语句 信息 (STATEMENT) = ON 2008-10-24 09:20:37.560724 
表 活 动 信 息 (TAREE) — GON 2008-10-24 09:20:37.560724 
获取 时 间 戳 记 信 息 (时 间 礁 记 ) = ON 2008-10-24 09:20:37.560724 
工作 单元 信息 (UOW} ON 2002—10 24 090:20:37.560724 


在 打开 合适 的 监控 器 开关 之 后 ， 您 可 以 在 同一 DB2 命令 窗口 中 使 用 get snapshot 命令 


来 收集 监控 统计 信息 。 例 如 ， 尝 试 使 用 TESTDB 数据 库 来 获取 快照 。 在 DB2 命令 窗口 中 ， 
发 出 下 列 合 令 : 


C:\> db2 connect to TESTDB 
C:\> db2 select * from sysibm.sysdummyl 
CN\> dh2 get snapshok for all on TESTDE 


我 们 将 在 下 面 的 内 容 中 更 详细 地 讨论 快照 监视 。 


3) SQL 解释 工具 (详细 描述 请 参见 本 书 “ 第 9 章 : SQL 语句 调 优 ”) 
SQL 解释 工具 提供 得 询 优 化 郁 为 SQL 语句 所 选择 的 访问 计划 有 关 的 详细 信息 。 该 信 


县 存储 在 解释 表 中 ， 可 以 在 稍 后 使 用 诸如 Visual Explain、db2expln、dynexpln 和 db2exfmt 
等 工具 进行 格式 化 输出 ， 从 而 以 较 友 好 的 方式 进行 表示 。 


解释 表 可 以 在 您 第 一 次 使 用 Visual Explain 时 目 动 进行 创建 。 即使 没有 创建 它们 ,您 


可 以 手工 进行 创建 ， 如 下 所 示 : 


Ci:N\> cd <db2 install path>\sqllib\misc 
C:\> db2 connect to TESTDB 
-> db “tvf EXPLALN. DOE 


本 例 中 ， 我 们 使 用 db2exfimt 工具 。 例 如 ， 使 用 db2exfmt 解释 动态 SQL 语句 ， 在 DB2 


命令 窗口 中 按照 下 列 步 又 进行 
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:\> db2 connect to <database name> 

:\> db2 set current explain mode explain 

:\> db2 -tvf <Input file with an SQL statement ended with a semlcolon> 
:\> db2 set current explain mode no 

:\> db2exfmt ~d <dbname> = 可 TIC ~-w 1 =n C:V\> =3 C:\> -#0 =o <output file> 


db2exfmt 工具 的 输出 包括 表 11-8 所 示 信 息 。 


a el a 


表 11-8 db2exfmt 输出 概述 


区 域名 称 内 容 
概述 DB2 版 本 和 发 布 级 别 ， 以 及 运行 解释 工具 时 的 日 期 和 时 刻 
数据 库 环 境 优化 器 为 确定 具有 最 少 资源 成 本 的 访问 计划 所 考虑 的 配置 参数 ,包括 并 行 度 、.CPU 


速度 、 通 信 速 度 、 绥 冲 池 大 小 、 排 序 堆 大 小 、 数 据 库 堆 大 小 、 锁 列表 大 小 、 最 大 
锁 列 表 、 和 平均 应 用 程序 和 可 用 锁 


程序 包 环 境 SQL 类 型 (动态 的 或 静态 的 )、 优 化 级 别 、 隔 离 级 别 以 及 语句 使 用 的 分 区 内 并 行 度 

初始 语句 应 用 程序 调用 的 SQL 语句 

优化 语句 优化 器 从 初始 语句 进行 转换 的 SQL 语句 的 改写 版 本 ， 这 些 语句 有 具有 相同 但 询 结 
果 ， 但 允许 最 优 性 能 

访问 计划 允许 DB2 访问 数据 以 解决 SQL 语句 的 最 小 扩展 路 径 

操作 符 描 述 展示 访问 计划 的 每 个 阶段 (操作 符 ) 发 生 什么 

访问 计划 中 使 用 的 


对 象 访问 计划 中 使 用 的 表 和 /或 索引 


我 们 将 在 下 面 的 内 容 中 提供 更 多 关于 db2exfmt 工具 的 例子 。 
5. 调 优 DB2 配置 参数 


DB2 数据 库 默 认 的 配置 参数 值 基于 使 用 256MB RAM 和 单个 磁盘 的 系统 。 如果 您 具有 
一 个 较 大 的 系统 ， 恕 需要 修改 这 些 参数 ， 以 便 最 好 地 利用 系统 资源 。 您 可 以 通过 使 用 
Confisuration Advisor 人 确定 调 优 配置 的 民 好 起 点 ，Configuration Advisor 基于 您 的 系统 资源 
来 推荐 数据 库 参 数值 。 为 了 运行 Configuration Advisor， 要 使 用 autoconfigure 命令 ， 或 者 通 
过 Control Center 调用 它 ， 右 击 想 要 配置 的 数据 库 ， 并 选择 Configuration Advisor。 或 者 使 
用 数据 库 的 目 调 优 内 存 (self_tuning mem) 使 数据 库 目 动 地 调整 部 分 内 存 的 大 小 来 适应 负载 
的 要 化 。 

出 于 实验 目的 ,我们 不 在 本 例 中 运行 Configuration Advisor, 而 是 手工 调 优 不 同 的 参数 。 
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这 里 摘 述 的 配置 参数 包括 : 
e 绥 冲 池 
异步 页 面 清理 器 和 IO 服务 器 
排序 
日 志 绥 冲 区 大 小 
分 组 COMMIT 语句 


1) 缓冲 池 

在 诸如 读 、 写 、 更 新 和 删除 的 所 有 事务 性 活动 期 间 ， 缓 冲 池 充 当 数据 库 执行 大 多 数 数 
据 操作 (除了 大 对 象 和 长 字段 数据 ) 在 “内 存 中 ”的 工作 区 域 。 每 个 数据 库 都 至 少 需要 一 个 
缓冲 池 。 对 于 具有 大 于 一 种 页 面 大 小 的 表 空 间 的 数据 库 而 言 ， 需 要 创建 具有 匹配 页 面 大 小 
的 新 的 缓冲 池 。 

缓冲 池 竞 争 可 以 成 为 影响 数据 库 性 能 的 重要 因素 。 如 果 缓 冲 池 大 到 足以 在 内 存 中 保存 
所 有 需要 的 数据 ， 就 会 发 生 最 少 的 磁盘 活动 。 相 反 ， 如 果 缓 冲 池 太 小 ， 那 么 数据 库 的 整体 
性 能 就 可 能 受到 严重 影响 ， 而 在 应 用 程序 需要 进行 大 量 的 磁盘 活动 的 情况 下 ，IO 就 很 有 
可 能 成 为 整个 数据 库 性 能 的 瓶颈 。 


配置 
为 了 确定 数据 库 中 缓冲 池 的 大 小 ， 请 查看 如 下 语句 : 
CAN> db2 Connect to TESTDB 


C:\> db2 "select BPNAME,NPAGES, PAGESIZE from SYSCAT .BUFFERPOOLS" 
BPNAME NPAGES PAGESI ZE, 


IBMDEFAULTBP 250 4096 
1 record(s) selected. 


输出 显示 TESTDB 数据 库 定 义 了 一 个 绥 冲 池 (IBMDEFAULTBP)， 该 缓冲 池 具 有 250 
个 页 面 NPAGES), 每 个 页 面 大 小 (PAGESIZE) 为 4096 字 节 。Windows 上 IBMDEFAULTBP 
的 默认 大 小 是 250 个 页 面 ， 而 在 UNIX 平台 上 ， 默 认 大 小 是 1000 个 页 面 。 当 NPAGES 的 
值 为 - 1 时 ， 绥 冲 池 大 小 就 是 由 数据 库 配 置 参 数 中 的 BUFFPAGE 参数 确定 的 。 例 如 : 


C:\> db2 get db cfqg for TESTDB 

Buffer pool size (pages) (BUFFPAGE) = 250 
监控 

DJ 工 


因为 缓 神 池 的 目的 束 是 为 了 在 内 存 中 保存 页 面 ， 用 于 数据 库 服务 夯 所 再 的 数据 操作 ， 
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以 锡 从 磁盘 谈 取 页 面 ， 所 以 对 于 绥 神 池 有 效 性 的 一 个 重要 测量 方法 束 是 看 所 请 求 的 页 面 有 
多 频 索 地 存在 于 缓冲 池 中 。 缓 冲 池 命中 率 (hit ratio) 测 量 该 有效 性 ， 它 可 以 按照 下 列 方 法 进 
行 计算 : 

BPHR= (1- ( (缓冲 池 数 据 物 理 读 + 缓冲 池 索 引物 理 读 ) / (缓冲 池 数 据 逻 辑 读 + 缓冲 池 索 引 逻 辑 读 ) ) ) 
| 

命中 率 越 接近 100%， 人 磁盘 IO 的 频率 束 越 低 ， 因 而 读 取 数据 的 开销 就 越 少 。 

监控 缓冲 池 活 动 的 各 用 方法 是 使 用 缓冲 池 快 照 , 如 下 所 示 ( 注 意 : 确保 缓冲 池 监 控 器 开 
关 是 ON。 和 否则 ， 在 快照 监控 期 间 ， 就 不 会 收集 大 多 数 缓冲 池 统 计 信 息 ): 

C:\> db2 get snapshot for bufferpools on <database name> 

应 该 关注 的 缓冲 池 快 照 的 重要 元 素 如 下 : 

Buffer Pool data loglcal reads = 16359 

Buffer pool data physical reads = 209 


Buffer pool index logical reads = 90 
Buffer pool index physical reads = 52 


以 上 信息 显示 了 98.4% 的 良好 缓冲 池 命 中 率 。 

实验 

从 命令 提示 符 窗口 启动 DB2 性 能 测试 程序 : 

CcC:\> DB2 性 能 测试 程序 

图 11-17 显示 了 用 一 个 包含 250 个 4KB 页 和 面 的 绥 冲 池 所 完成 的 事务 数 日 (注意 : 由 于 
便 件 资源 不 同 ， 谈 者 系统 上 的 性 能 结果 可 能 和 此 处 的 实验 结果 不 同 )。 
图 DB2 性 能 测试 程序 -By 表 春 


性 能 铀 试 设置 
小 抠 库 东 TESTDB 


el 


RE A 贡 本 帮助 (Hi 
应 用 程序 | 进程 虽 | 联网 | 用 户 | 


冲 斌 时 间 三 | 和 CET 任用 FFV 司 用 记录 
迄 行 | ] 售 止 | 重 置 
页 面 立 伞 遍 用 记录 
已 完成 的 变易 煞 目 
站 生生 和 
已 耗 时 
gE 
225 3, 1S571180 
10.0 sec 线程 其 934 | | 可 用 数 560952 
进程 长 565 于 这些 站 S55] 32 
让 可 用 量 \ 敬 棱 避 内 趣 已 
总 激 1088838 总 数 110160 
恨 旬 | 5202B7B 切 焉 数 B392 
惧 值 11358312 Ea ESBES 


图 11-17 使 用 包含 250 个 4KB 内 存 页 面 的 缓冲 池 的 性 能 结果 
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在 完成 测试 运行 之 后 ， 束 获取 绥 冲 池 快 照 ， 如 下 所 示 : 


C:\> db2 get snapshot for bufferpools on TESTDB 


BUG od data logical reads = 75875 
Buffer pool data physical reads = 59419 
Buffer pool index logical reads = 296 
Buffer pool index physical reads = 208 


缓冲 池 命 中 率 =(1 - (59419+ 208)/ (75875+ 208)) * 100 =21.63%, 通过 250 个 页 面 的 
缓冲 池 大 小 ， 应 用 程序 测试 运行 呈现 了 21.63% 的 粳 粒 的 缓冲 池 命 中 率 。 
联机 增加 缓冲 池 大 小 ， 如 下 所 示 : 


CA> db2 connect to TESTDB 
C:\> db2 "alter bufferpool IBMDEFAULTBP immediate size 12000" 


在 发 出 以 上 命令 时 ， 请 合 看 任务 官 理 硕 ， 以 便 看 到 内 存 使 用 古 如 何 增加 的 。 
监控 信息 是 累 和 sn 除非 您 置 ! ry 因为 我 们 需要 在 修改 绥 冲 池 大 小 之 后 获得 新 
的 绥 神 池 命中 率 ， 所 以 要 在 下 一 次 测试 运行 乙 前 用 以 下 命令 重新 设置 所 有 监控 船 : 


人 二 monitor all 


单 击 “DB2 性 能 测试 程序 ”屏幕 上 的 “ 重 置 ”按钮 ， 然 后 单 击 “ 运 行 ”。 通 过 12000 
个 4KB 页 面 的 更 大 缓冲 池 ， 人 性 能 结果 从 每 10 秒 完 成 8 个 事务 增加 到 完成 598 个 事务 ， 如 
图 11-18 所 示 。 


和 / 
性 论 训 试 设置 tt 和 Eee 关机 (Ui 帮助 
数据 库 各 TESTDB 应 用 程序 | 进程 ”全能 | 联网 | 用 户 | 


训 试 时 间 


训 试 结果 


页 面 况 件 使 用 记录 
巨 运 成 的 变易 煞 有 目 
已 耗 时 
六 Ee 
29213 总 1571180 

10.0 Ser 线程 小 336 可 用 小 SB1B84 
进程 数 55 系统 绿 存 595932 
认可 用 量 点 ) 核心 内 存 蝶 : 
总 类 1111492 总 类 104468 
限制 | 2202BTB 节 丰 类 STT9B 
| 峰值 2 | 未 蕊 页 3 


进程 数 : 85 CPU 使 用 , 7% 提交 更 或 , 1085M / 2151M 
图 11-18 ”使 用 包含 12000 个 4KB 内 存 页 面 的 缓冲 池 的 性 能 结果 
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获取 新 的 快照 ， 并 计算 新 的 缓冲 池 命 中 率 ， 如 下 所 示 : 


C:N\> db2 connect to TESTDB 
C:\> db2 get snapshot for bufferpools on TESTDB 
Buffer Pool data logical reads = 2137439 
Buffer pool data physical reads = 1594 
三 BZ 
Buffer pool index physical reads = 50 


Buffer pool index logical reads 


缓冲 池 命 中 率 = (1 - (1594 + 50)/(2137439 + 82)) * 100% = 99.92% 

现在 的 缓冲 池 命 中 率 就 显示 了 较 好 的 结果 。 一 般 情 况 下 ， 绥 冲 池 命 中 率 在 90% 以 上 就 
认为 是 民 好 的 。 如 果 您 的 系统 其 有 较 低 的 缓冲 池 命 中 率 ， 您 就 可 以 通过 增加 绥 冲 池 大 小 来 
进一步 取得 更 好 的 应 用 程序 性 能 结果 。 如 果 将 绥 冲 池 大 小 增加 a 到 20 000 个 4KB 页 面 并 重 
新 运行 DB2 性 能 测试 程序 ， 那 将 会 发 生 什 么 情况 呢 ? 性 能 会 有 所 提高 吗 ? 

在 这 种 情况 下 ， 性 能 可 能 不 会 提高 。IESITDB 数据 库 的 大 小 约 为 36 MB。 这 和 意味 看 整 
个 数据 库 都 可 以 进入 内 存 。12000 个 页 面 (48MB) 或 20000 个 页 面 (80MB) 的 大 小 将 没有 区 别 ， 
因为 整个 数据 库 都 可 以 包含 在 48MB 中 。 实 际 上 ， 取决 于 应 用 程序 所 执行 的 SQL 的 类 型 ， 
将 缓冲 池 的 大 小 增加 到 某 个 极限 之 后 就 可 能 不 会 再 提高 性 能 了 。 我 们 建议 您 不 断 增 加 缓冲 
池 大 小 ， 直 到 看 到 不 再 有 性 能 提高 为 止 。 

与 其 他 内 存 绥 冲 区 相 比 ， 绥 冲 池 对 数据 库 性 能 的 影响 最 为 显 普 。 但 是 请 记 住 ， 绥 冲 池 
是 操作 系统 共享 内 存 集中 的 一 部 分 。 在 32 位 的 数据 库 环 境 中 ，DB2 具有 数据 库 共享 内 存 
大 小 的 限制 ，AIX 上 是 1.75GB，Sun Solaris 上 是 3.35GB，HP-UX 上 是 0.75GB 到 1] GB 之 
间 的 值 ，Linux 上 是 1.75GB，Windows 上 是 2GB 或 3GB( 假 设 boot.ini 中 启用 了 3GB 开关 ); 
因此 ， 您 需要 平衡 缓冲 池 与 其 他 共享 内 存 绥 神 区 的 配置 。 在 64 位 的 数据 库 环境 中 ,这 是 一 
个 不 需要 考虑 的 问题 。 


2) 异步 MO 服务 器 和 页 面 清理 器 

DB2 避 励 缓冲 池 与 磁盘 之 间 页 面谈 写 的 异步 IO 访问 ， 以 便 获得 最 优 性 能 。 

IO 服务 器 (db2pfchr) 将 数据 页 异步 地 从 磁盘 读 入 参与 应 用 程序 需求 的 缓冲 池 中 ， 这 称 
作 “ 预 取 ”(prefetching)。 预 取 可 以 提高 数据 库 的 性 能 ， 因 为 当代 理 访 问 这 些 页 面 时 ， 将 在 
缓冲 池 中 找到 它们 ， 从 而 减少 了 应 用 程序 等 待 页 面 从 磁盘 读 入 绥 冲 池 的 时 间 。 

男 一 方面 ， 在 数据 库 代 理 需 要 缓冲 池 中 的 空间 之 前 ， 页 面 清理 器 (db2pcln?) 将 已 修改 的 
页 面 从 缓冲 池 写 入 磁盘 。 因 此 ， 数 据 库 代 理 不 必 等 待 写 出 修改 的 页 面 ， 就 可 以 使 用 缓冲 池 
中 的 空间 。 这 将 提高 数据 库 的 整体 性 能 。 页 面 清 理 器 可 以 通过 多 种 理由 触发 ， 例 如 ， 当 达 
到 已 修改 页 面 的 国 值 时。 异步 IO 服务 左 、 页 面 清理 器 和 数据 库 其 他 组 件 的 关系 如 图 11-19 
所 示 。 
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图 11-19 寞 步 VO 服务 器 、 页 面 清理 器 与 数据 库 其 他 组 件 之 间 的 关系 


配置 

用 于 数据 库 的 IO 服务 器 ( 预 取 器 ) 的 数目 可 以 使 用 num ioservers 数据 库 配置 参数 进行 
配置 。 为 了 充分 利用 系统 中 的 所 有 LO 设备 ， 使 用 较 好 的 值 ， 该 值 通常 比 数据 库 所 驻 留 的 
物理 设备 的 数目 多 一 两 个 。 最 好 配置 更 多 的 IO 服务 器 ， 因 为 每 个 IO 服务 器 相关 的 开销 
非常 小 ， 而 未 使 用 的 VO 服务 器 仍然 将 保持 空 朵 

num iocleaners 数据 库 配置 参数 允许 您 为 数据 库 指 定 异 步 页 面 清理 器 的 数目 。 在 为 该 
参数 设置 值 时 ， 要 考虑 下 列 因 素 : 

e 应 用 程序 类 型 如 果 是 一 个 不 具有 更 新 而 仅仅 和 但 询 的 数据 库 ， 束 将 该 参数 设置 为 

0。 当 查询 工作 负载 导致 创建 许多 TEMP 表 ( 您 可 以 通过 使 用 解释 实用 程序 来 确定 ) 
时 除外 。 如 果 事 务 是 对 数据 库 运 行 的 ， 那 么 就 将 该 参数 设置 成 1 到 用 于 该 数据 库 
的 物理 存储 设备 数目 之 间 的 值 。 

e 工作 负载 ， 具 有 较 高 事务 更 新 率 的 环境 (OLTP) 可 能 需要 配置 更 多 页 面 清 理 器 。 

e 绥 冲 池 大 小 : 具有 大 型 组 神 池 的 环境 也 可 能 需要 配置 更 多 页 面 清理 需 。 

还 请 记 住 ， 配置 太 多 页 面 清 i 理 占 可 能 会 损害 数据 库 服务 右上 的 运行 队列 ， 并 导 笃 极 大 
的 性 能 下 降 。 因 此 ， 根 据 经 验 ， 您 可 以 考虑 将 页 面 清理 需 的 数目 设置 为 与 数据 库 服务 左上 
CPU 的 数目 相同 。 

己 修 改 页 面 的 阔 值 参数 (chngpgs thresb) 决 定 异步 页 面 清理 器 应 启动 时 已 修改 页 面 的 百 
sis 
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监控 
因为 异步 页 面 清理 器 和 异步 TO 服务 器 的 活动 与 缓冲 池 活 动 是 如 此 紧密 联系 ， 所 以 您 
可 以 再 次 利用 缓冲 池 快照 来 测量 页 面 清理 器 和 预 取 器 的 有 效 性 。 
这 里 ， 缓 冲 池 快照 的 重要 元 素 将 重点 放 在 了 下 面 : 


Buffer pool data logical reads = 2700145 
Buffer pool data writes = 0 


Buffer pool index logical reads = 95 
Asynchronous pool data page reads = 8 
Asynchronous pool data page writes = 0 
Buffer pool index writes = 0 
Asynchronous pool index page reads = 0 
Asynchronous pool index page writes = 0 


预 取 活动 可 以 通过 异步 和 同步 的 谈 IO 来 确认 。 异 步 读 取 比 率 按照 下 列 公式 计算 : 
( (异步 池 数 据 页 读 + 异步 池 索 引 页 读 ) / (缓冲 池 数据 逻辑 读 + 缓冲 池 索引 逻辑 读 )) * 100g 


异步 恋 取 比率 值 较 小 可 能 是 由 多 种 原因 导 任 的 ， 例 如 : 

e 工作 负载 谈 写 单行 ， 因 此 无 法 利用 预 取 。 

e 为 数据 库 配 置 的 预 取 需 太 少 。 

e 数据 库 中 的 表 衬 间 仅 仅 配 置 了 一 个 容器 ， 以 致 无 法 进行 预 取 。 

寞 步 幢 面 清 理 占 的 有 效 性 是 由 腊 步 数据 和 索引 页 的 写 比 率 进 行 测量 的 。 如 果 下 列 两 个 
条 件 都 成立， 束 可 以 减少 异步 页 面 清理 右 的 数目 (num iocleaners): 

e 缓冲 池 数据 与 约 等 于 异步 池 数 据 页 写 。 

e 绥 冲 池 索 引 与 约 等 于 寞 步 池 索引 页 写 。 

如 果 下 列 条 件 中 有 一 个 成 立 ， 束 应 增加 该 参数 : 

e 绥 证 池 数 据 与 远 远大 于 异步 池 数据 页 与 。 

e 绥 冲 闻 索 引 写 远 远 大 于 措 步 池 索引 页 写 。 


示例 

和 首先， 确认 num ioservers 和 num iocleaners 参数 的 当前 设置 : 

C:\> db2 get db cfqg for TESTDB 

Number of asynchronous page cleaners (num locleaners) = 1 
Number of I/O servers (num oservers) 一 3 


在 DB2 性 能 测试 程序 的 下 一 次 运行 之 前 ， 重 置 快照 监控 器 : 


CN> db2 reset monitor all 
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这 里 ， 绥 冲 池 快照 通过 应 用 前 面 讨论 的 规则 ， 用 于 验证 系统 上 是 否 正 确 配 置 了 了 num 


ioservers 和 num iocleaners 参数 。 
C:\> db2 get snapshot for bufferpools on TESTDB 


Buffer pool data loglical reads = 269482 
Buffer pool data writes = 0 


Buffer pool index logical reads = 82 
Asynchronous pool data page reads = 12306 
Asynchronous pool data page writes = 0 
Buffer pool index writes = 0 
Asynchronous pool index page reads = 0 
Asynchronous pool index page writes = 0 


异步 读 取 比 率 = ((1236 + 0)/(269482 + 82)) * 100% = 0.004% 

异步 恋 取 比率 如 此 小 的 原因 是 数据 库 中 的 每 个 表 空 同 仪 仅 设 置 了 一 个 容 咽 ， 以 至 无 法 
进行 预 取 。 因 此 ，num ioservers 参数 的 当前 设置 可 以 保持 相同 。 

然后 ， 您 需要 检查 缓冲 池 数 据 写 (0) 与 异步 池 数 据 页 写 (0) 以 及 缓冲 池 索 引 写 (0) 与 异步 
池 索 引 写 (0) 的 监控 数据 。 通 过 应 用 前 面 讨论 的 规则 ， 表 明 num iocleaners 参数 不 需要 进行 
进一步 的 调 优 工作 。 

chngpgs thresh 的 60% 的 默认 值 对 于 OLTP 工作 人 负载 而 言 通 第 太 局 了 。 介 于 20% 和 40% 
之 间 的 值 会 更 好 一 些 。 例 如 ， 如 果 您 具有 一 个 2GB 的 缓冲 池 ， 当 达到 60% 的 修改 页 面 时 ， 
在 触发 页 面 清理 器 时 就 有 1.2GB(2GB 的 60%0) 写 入 磁盘 。 当 这 发 生 时 ， 可 能 导致 系统 整体 
速度 的 下 降 。 通 过 将 chngpgs _thresh 设置 为 较 低 的 数 ， 如 20%， 将 更 频繁 地 触发 页 面 清 理 
器 ， 但 只 有 较 少 的 数据 写 入 磁盘， 而 用 户 也 觉察 不 到 这 一 延迟 。 


3) 排序 
DB2 具有 两 种 基本 类 型 的 排序 : 共享 排序 和 私有 排序 。 
只 有 intra parallel 数据 库 管 理 辟 配置 参数 是 ON 或 局 用 集中 器 (concentrator) 时 ( 当 
max connections 大 于 max coordagents 时 )， 才 可 以 使 用 共享 排 厅 。 通 常 在 和 需要 具有 多 个 子 
代理 人 给 (subagent feeding) 或 从 排序 中 进行 预 取 时 使 用 它 宅 们 .用 于 共享 排序 的 内 存 是 从 数据 
库 共 至 内 存 集中 分 配 的 。 
当 Intra parallel 参数 是 off， 并 有 旦 禁用 集中 疾 (concentrator) 时 ， 所 有 的 排序 整 都 是 私有 
的 。 闭 入 和 创建 索引 的 操作 通常 使 用 私有 排序 进行 索引 键 的 排序 ， 无 论 intra_parallel 参数 
的 值 如 何 。 用 于 私有 排序 的 内 存 是 从 代理 的 私有 内 存 中 分 配 的 。 因 此 ， 私 有 排序 只 能 被 单 
个 代理 访问 。 
对 于 共有 至 排 厅 ，sheapthres_shr 数据 库 配 置 参 数 是 数据 库 范 围 的 可 以 用 于 任何 一 次 排 订 
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的 数据 库 共 享 内 存 总 数 的 人 刹 限制 。 当 用 于 活动 共 至 排序 的 共 人 圣 内 存 总 数 达到 了 该 极限 时 ， 
随后 的 排序 束 会 以 SQL0955 错误 人 码 失 败 。 如 果 sheapthres shr 的 值 是 0， 那么 共享 排序 内 
存 的 阔 值 将 等 于 数据 库 管 理 占 配置 参数 sheapthres 的 值 ， 该 参数 也 用 于 限制 DB2 实例 中 可 
用 的 私有 排序 内 存 总 和 的 最 大 值 。 

在 共 至 排序 和 私有 排序 中 ，sortheap 数据 库 配 置 参数 是 将 用 于 单个 排序 的 4KB 内 和 存 页 
面 的 最 大 数目 。 

同样 ， 排 序 包 含 两 个 阶段 : 


排序 阶段 : 排序 可 以 是 溢出 的 ， 也 可 以 是 非 滋 出 的 。 如 果 无 法 将 排序 的 数据 整个 
放 入 排序 堆 (sorhteap) 中 (排序 堆 是 每 次 执行 排序 时 分 配 的 一 块 私有 内 存 )， 就 会 溢出 
到 数据 库 的 临时 表 中 。 显 然 由 于 不 溢出 的 排序 是 在 内 存 中 完成 ， 因 此 通 币 执行 得 
比 那 些 溢出 的 排序 效率 要 高 。 

排序 结果 的 返回 阶段 : 返回 可 以 是 管道 的 (piped)， 也 可 以 是 非 管 道 的 non-piped)。 
如 条 排序 信息 可 以 直接 返回 ， 而 无 需 临 时 表 来 存储 最 终 排序 的 数据 列表 ， 那 束 是 
管道 排序 (piped sort)。 如 果 排 友信 息 的 返回 需要 临时 表 ， 那 就 是 非 管 道 排 友 (non- 
piped sorb)。 上 所 以 管道 排序 的 效率 通 第 比 非 管道 排序 的 效率 要 局 。 


想 首 
卫 置 sheapthres: 


通 币 应 将 sheapthres 设置 为 sortheap 的 倍数 。 

通常 的 经 验 是 将 sheapthres 至 少 设置 为 10 * sortheap。 

对 于 市 有 intra parallel on 的 索引 创建 ， 请 确保 sheapthres >= d * sortheap， 其 中 d 
是 SMP 上 度 (degree)。 

对 于 LOAD， 上 所 有 索引 键 的 排序 都 是 在 进程 的 私有 内 存 空间 中 同时 进行 的 : SMP 
中 的 db2lrid， 串 行 中 的 db21frm0。 要 确保 sheapthres >= n * sortheap， 其 中 是 装 
入 的 表 上 的 索引 数目 。 还 请 记 住 ，AIX 上 有 最 大 为 250MB 的 私有 虚拟 内 存 用 于 
LOAD 中 的 索引 键 排序 (这 是 丹 存 使 用 的 限制 )。 


配置 sortheap: 


增加 sortheap 的 值 可 以 显 兰 地 提高 排序 性 能 ， 因 为 能 够 在 内 存 中 完成 的 排序 将 更 
多 ， 而 相应 的 磁盘 IO 将 减少 。 

将 sortheap 配置 小 了 可 能 导致 由 于 深 出 而 引起 的 VO 增加 所 着 来 的 性 能 下 降 。 

将 sortheap 配置 大 了 则 导致 容量 了 问题， 因为 将 会 更 快 地 超出 sheapthres 的 限制 。 同 
样 ， 因 为 到 达 sheapthres shr( 用 于 共享 排序 ) 或 超出 sheapthres( 用 于 私有 排序 )， 分 配 
给 新 排序 的 内 存 数目 将 不 断 减 少 ， 这 可 能 也 会 导致 性 能 下 降 。 
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监控 
除了 缓冲 池 , 排序 是 影响 数据 库 性 能 的 另 一 重要 因素 .DB2 监控 排序 活动 的 很 多 方面 。 
数据 库 管 理 器 快照 展示 下 列 监 控 元 素 : 


C:\> db2 get snapshot for database manager 
Private Sort heap allocated = 0 

Private Sort heap high water mark = 80 
POSE hreshold sorts = 申 

Piped sorts requested = 167 

Piped sorts accepted = 167 


数据 库 快 照 展示 下 列 监控 元 素 : 


C:\> db2 get snapshot for database on <database name> 
Total Private Sort heap allocated = 0 

Total Shared Sort heap allocated 0 

Shared Sort heap high water mark = 0 

Tobal sorts = 1I0 

Total sort time (ms = 5015 

Sort overflows = 93 


Active sorts = 0 
Commit statements attempted = 446 
Rollback statements attempted = 24 


下 面 列 出 了 几 个 用 于 评估 排序 活动 性 能 的 关键 公式 : 

装 值 后 排序 (Post threshold sorb 是 指 在 超出 排序 堆 闪 值 之 后 ， 请 求 堆 的 排序 数目 。 在 到 
达 排 序 堆 国 值 之 后 开始 的 排序 可 能 不 会 得 到 适量 的 内 存 去 执行 排序 。 

闵 值 后 排序 率 = ( 闭 值 后 排序 / 总 排序 ) * 100% 

如 果 闪 值 后 排序 率 很 高 ， 您 就 应 该 增加 排序 堆 阔 值 (sheapthres)， 或 通过 修改 SQL 碍 
询 来 调整 应 用 程序 以 使 用 较 少 或 较 小 的 排序 内 存 。 

管道 排序 率 = (接收 的 管道 排序 / 请 求 的 管道 排序 ) * 100% 

如 条 管 道 排 序 率 的 值 很 低 ， 您 束 应 该 考 碟 增加 排序 堆 国 什 (sheapthres) 以 获得 更 局 的 排 
序 性 能 。 

排序 溢出 率 = (排序 溢出 / 总 排序 )* 100% 

如 果 排 序 溢 出 率 的 值 很 高 ， 您 就 应 该 增加 排序 堆 (SORTHEAP)， 并 且 / 或 者 也 增加 排序 
堆 国 值 (sheapthres)。 

每 个 事务 的 排序 = 总 排序 / (尝试 的 提交 语句 + 尝试 的 回 深 语 句 ) 

当 每 个 事务 有 3 个 或 更 多 排序 时 ， 驶 不 应 该 首先 调 优 排序 堆 或 排序 堆 阔 值 ， 而 是 应 该 
自 先 查找 应 用 中 的 问题 源 ， 通 过 动态 SQL 快照 确定 执行 较 差 的 SQL 语句 ， 并 在 必要 处 添 
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加 合适 的 索引 。 


示例 

DB2 性 能 测试 程序 是 OLTP 应 用 程序 ， 因 此 没有 复杂 的 SELECT 会 询 ， 排 序 也 很 少 。 
这 里 的 示例 用 于 检查 读者 目 己 环境 中 的 排序 调 优 技 术 。 

这 里 的 准备 步骤 是 为 了 将 ibmdefaultbp 的 大 小 重新 减 小 到 250 个 页 面 ， 将 sortheap 减 
小 到 16 个 页 面 ， 以 便 您 可 以 在 小 型 数据 库 环境 中 僵 看 相关 的 性 能 调 优 拉 术 。 
:> db2 Connect to TESTDB 
:\> db2 "alter bufferpool ibmdefaultbp size 250" 
:\> db2 update db cfqg for TESTDB using sortheap 16 


:\> db2 force applications all 
:\> db2 connect to TESTDB 


为 了 和音 置 快照 监控 融 ， 要 发 出 : 


ed ed Md a 


CN> dD2 reset monitor all 

您 可 以 创建 SQL DDL 文件 order by.ddl， 包 含 该 SQL: 

SELECT NAME.,BALANCE FROM ACCOUNT ORDER BY BALANCE 

为 了 在 数据 库 中 触发 排 序 活动 ， 要 重复 下 列 命 令 多 次 ， 例 如 3 次 : 
C:\> db2 -tvf order by.ddl 

数据 库 管 理 器 快照 可 以 用 于 确定 国 值 后 排序 活动 : 

CY Gb2 get snapshot for database manager 


Private Sort heap allocated = 0 

Private Sort heap high water mark = 256 

Eost Threshold sorts —0 

Piped sorts requested = 3 

Piped sorts accepted = 3 

其 中 没有 立 值 后 排序 活动 。 然 而 ， 管 道 排序 是 100% 接 受 的 ， 管 道 排 序 率 = (3 / 3) * 
100% = 10070。 

然后 ， 可 以 利用 数据 库 快 照 来 确定 数据 库 层 的 排序 活动 : 


C:\> db2 get snapshot for database on TESTDB 


Total Private Sort heap allocated = 0 
Total Shared Sort heap allocated = 0 
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shared Sort heap high water mark = 0 
Total sorts = 3 

Total sort time (ms) = 1097 

Sor (Overilons — 3 

Active sorts = 0 

Commit statements attempted = 4 
Rollback statements attempted — 3 


排序 溢出 率 = (3 / 3) * 100% = 100%。 由 于 这 个 较 高 的 排序 溢出 率 ， 您 需要 增加 排序 
堆 (sortheap) 和 /或 排序 堆 浆 值 (sheapthres)。 

按照 通过 快照 监控 进行 的 排序 活动 的 健康 检查 ， 您 现在 需要 增加 排序 堆 (SORTHEAP) 
和 /或 排序 扒 效 值 (sheapthres)。 

为 了 增加 sortheap 参数 ， 要 发 出 : 


C:\> db2 update db cfqg for TESTDB using sortheap 400 
C:\> db2 force applications all 


在 每 次 修改 中 ， 使 用 快照 监控 来 确定 是 否 需要 进一步 的 排序 调 优 。 如 果 需 要 ， 就 重复 
相同 的 步 又 。 


4) 日 志 缓冲 区 大 小 
日 志 绥 冲 区 作为 内 存 中 的 分 级 区 域 (staging area) 来 保存 日 志 记 录 , 而 不 是 让 DB2 引擎 
直接 将 每 条 日 志 记 录 写 入 磁盘 中 。 
当 发 生 下 列 条 件 之 一 时 ， 将 日 志 记 录 写 入 磁盘 : 
e 达到 mincommit 配置 参数 所 定义 的 事务 提交 或 事物 组 提交 
e 日 忘 绥 冲 区 已 满 
lr EN 


or 
志 绥 冲 区 大 小 是 由 logbufsz 数据 库 参 数 定 义 的 。 如 果 在 某 个 专用 的 日 志 磁 盘 上 存在 
aie 或 者 具 ya 交 增 加 日 志 缓 冲 区 的 大 小 。 在 增加 
LOGBUFSZ 参数 的 值 时 ， 您 还 应 该 考虑 数据 库 堆 (dbheap) 参 数 ， 因 为 日 志 绥 冲 区 的 内 存 来 
自 数 据 库 堆 中 的 空间 。 


监控 


可 以 通过 查看 下 列 快照 元 又 使 用 数据 库 快 照 来 确定 logbufsz 数据 库 参 数 是 人 否 最 优 : 


C:\> db2 get snapshot for database on <database name> 
LOg Pages read = 0 
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LOg pages written = 6721 


日 志 页 面 读 (log pages read) 是 日 志 记 录 器 (loggenD) 从 磁盘 读 取 的 日 志 页 面 的 数目 ， 而 日 
志 页 面 写 (log pages Write 由 是 日 志 记 录 器 (loggenD 写 入 磁盘 的 日 志 页 面 的 数目 。 日 志 页 面 读 
数目 与 日 志 页 面 写 数目 的 比值 应 尽 可 能 小 。 理 想 情 况 下 ， 应 该 没有 日 志 页 面 读 。 如 果 看 到 
较 多 数目 的 日 志 页 面 读 ， 就 表示 应 该 增加 logbufsz 数据 库 参 数 的 值 。 


示例 
对 于 具有 许多 更 新 工作 负载 的 数据 库 系 统 而 言 , 日 志 绥 冲 区 的 默认 大 小 (logbufsz) 通 沼 
都 太 小 : 


CN> db2 get db Cfq for TESTDB 
LOg buffer size (4KB) (LOGBUFSZ) = 8 


DB2 性 能 测试 程序 没有 太 多 的 数据 更 新 。 因 此 ， 您 不 会 在 这 里 的 DB2 性 能 测试 程序 
的 快照 中 发 现 logbufsz 参数 需要 调 优 的 提示 。 但 是 ， 您 仍然 可 以 在 自己 的 应 用 程序 中 进行 
尝试 。 如 果 您 的 应 用 程序 碰巧 具有 比较 高 的 数据 更 新 工作 负载 ， 那 么 数据 库 快照 监控 就 可 
以 暴露 大 量 的 日 志 页 面 读 。 如 果 情 况 如 此 ， 您 就 可 以 考虑 增加 logbufsz 数据 库 参数 。 通 党 
应 将 它 增加 为 不 少 于 256 页 面 。 


5) 组 中 提交 数目 

在 发 生 许 多 较 短 并 发 事务 的 环境 中 ， 每 条 COMMIT 语句 默认 触发 对 磁盘 的 一 次 日 志 
缓冲 区 刷新 (flush)。 因 此 ， 日 志 记 录 器 (logger) 进 程 频繁 地 将 少量 日 志 数 据 写 入 磁盘 中 ， 这 
就 会 导致 大 量 的 日 记 VO 开销 而 引起 的 性 能 下 降 。 提 区 分 组 (commit grouping) 人 允许 到 达 请 求 
提交 数目 的 最 小 值 乙 后 才 将 日 志 绥 冲 区 数据 与 入 磁盘 。 该 功能 可 以 通过 减少 日 志 IO 的 数 


星 来 近 局 性 能 。 
仅仅 当 mincommit 参数 的 值 大 于 1 且 连 接 到 数据 库 的 应 用 程序 数目 大 于 或 等 于 该 参数 


的 值 时 ， 才 友 生 这 种 提交 分 组 。 在 执行 所 有 交 分 组 时 ， 可 以 将 应 用 程序 的 提交 请 求 持 起， 下 
到 1 秒 钟 之 后 或 提交 请 求 的 数目 等 于 mincommit 参数 的 值 。 


配置 

如 果 多 个 读 / 写 应 用 程序 通 第 请 求 并 友 的 数据 库 提交 , 就 从 默认 值 开始 增 加 mincommit 
参数 。 这 将 导 任 更 届 效 的 日 志文 件 TO， 因 为 它 将 友 生 得 不 那么 频 系 ， 并 在 每 次 发 生 时 与 
入 更 多 日 志 记 录 。 

也 可 以 对 每 秒 的 事务 数目 进行 取样 , 并 调整 该 参数 以 适应 每 秒 事 务 数 目的 峰值 (或 它 的 
条 些 较 大 比例 )。 适 应 峰值 活动 将 最 小 化 事务 密集 期 间 日 志 记 录 的 写 开 销 。 
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监控 
数据 库 快 照 监控 器 可 以 用 于 确定 每 秒 执行 的 事务 数目 ， 如 下 所 示 : 


CNS db2 get. snapshot for database on <database name> 


Last reset timestamp = 07/30/2005 15:54:22.392292 
snapshot timestamp = 07/30/2005 19:24:10.858723 
Commit statements attempted = 13784 

Rollback statements attempted = 134 


每 秒 的 事务 数目 : 
(尝试 的 提交 语句 + 尝试 的 回 滨 语 句 )/ (快照 时 间 截 - 最 后 重 置 的 时 间 蕉 )) 


示例 
MINCOMMIT 参数 可 以 给 数据 库 性 能 带 来 正面 或 负面 的 影响 , 所 以 需要 正确 设置 如 
果 是 在 低 并 发 的 环境 设置 该 参数 ， 那 么 可 能 会 给 你 的 系统 带 来 负面 的 性 能 影响 


C:\> db2 get snapshot for database on TESTDB 


Last reset 七 Imestamp = 07/30/2005 19:32:45.570089 
snapshot timestamp = 07/30/2005 19:33:14.650596€ 
Commit statements attempted = 7374 

Rollback statements attempted = 1 


每 秒 的 事务 数目 = (7374 +1)/(19:33:14.650596 - 19:32:45.570089)==254.13。 

考虑 到 DB2 性 能 测试 程序 仅仅 调用 较 少 的 10 个 并 发 应 用 程序 连接 ， 而 事务 的 数目 很 
大 (每 秒 254 个 事务 )， 所 以 不 应 修改 mincommit 参数 的 套 认 什 ; 否则 ， 将 显 赦 增加 那些 小 
事务 。 您 可 以 目 由 地 选择 一 些 设 置 进行 测试 ， 以 观察 各 种 情况 下 的 效果 。 


6. 数据 库 优化 器 


DB2 中 包含 了 功能 强大 的 基于 成 本 评估 的 查询 优化 器 ， 它 用 于 确定 访问 数据 的 最 佳 策 
略 .DB2 查询 优化 器 总 是 试图 通过 将 初始 查询 改写 成 优化 的 形式 , 生成 备 选 查 询 执行 计划 ， 
对 每 种 备 选 计划 的 TO、CPU、 内 存 和 通信 使 用 进行 建 模 ， 并 选择 成 本 最 小 的 访问 计划 执 
行 ， 这 样 就 能 确定 对 数据 库 执行 访问 的 效率 最 高 的 方法 。 


1) 更 新 目录 统计 信息 

会 询 优 化 融合 用 数据 库 中 的 SYSSTAT 目录 视图 来 检索 数据 库 对 象 的 统计 信息 ， 并 确 
定 访问 数据 库 的 最 佳 方法 。 如 朱 无 法 获得 当前 准确 的 统计 数据 ， 优 化 郁 束 可 能 会 基于 个 准 
确 的 默认 统计 数据 选择 低 效 的 访问 计划 。 
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默认 情况 下 ， 对 于 新 创建 的 数据 库 ， 直 到 执行 了 RUNSTATS 命令 之 后 ， 才 会 收集 数 
据 库 对 象 统计 数据 并 将 之 存储 在 SYSSTAT 目录 视图 中 。 如 果 还 没有 填充 目录 统计 数据 ， 
那么 SYSSTAT 目录 视图 中 诸如 CARD、NPAGES、FPAGES 等 列 就 具有 值 -1。 下 面 展示 
本 一 个 示例: 

俏 定 是 否 运 行 了 RUNSTIATS: 

CN> db2 connect Eo TESTDB 


C:\> db2 describe table sysstat.tables 
C:\> db2 "select tabname,card,npages,fpages from sysstat.tables" 


TABNAME, CARD NPAGES FPAGES 
ACCOUNT = 3 st 
AUDITLOG = 三 = 


我 们 强烈 建议 您 使 用 RUNSTATS 命令 收集 表 和 索引 上 的 当前 统计 数据 ， 特 别 是 当 发 
生 了 大 量 的 更 新 活动 或 由 于 上 次 执行 RUNSTATS 命令 而 创建 了 新 的 索引 时 。 这 就 为 优化 
圳 提供 了 用 于 确定 最 佳 访 问 计 划 的 最 准确 的 信息 。 例 如 : 


CN> db2 runstats on table <table name> with distribution and detailed 
1ndexes all 


其 中 ，<table_ name> 是 全 限定 的 表 名 ， 其 中 包含 了 模式 名 。 


有 时 候 ， 可 能 需要 对 数据 库 中 的 所 有 表 执 行 RUNSTATS 操作 。 这 样 做 最 容易 的 方法 
束 古 使 用 REORGCHEK 命令 : 


Ci:N\> db2 reorgchk update statistics on table all 


如 果 对 于 确定 数据 库 是 否 包 含 表 和 索引 上 的 最 新 统计 数据 有 困难 ， 您 就 可 以 发 出 下 列 
命令 来 验证 执行 RUNSTATS 操作 的 最 近 时 间 : 


CN db2 "seleeot name, Stots time from SYarbm systables 


如 果 仍 然 还 没有 运行 RUNSTATS， 您 将 会 看 到 stats time 列 为 "-"。 否 则 ， 它 就 返回 
最 后 一 次 运行 RUNSTATS 的 时 间 惟 。 
在 下 面 的 内 容 中 ， 我 们 将 在 运行 RUNSTATS 之 后 测试 DB2 性 能 测试 程序 。 


2) 缓存 糟糕 的 查询 

应 用 程序 可 以 运行 上 百 条 不 同 的 SQL 语句 ; 如 果 其 中 只 有 一 条 的 代码 不 正确 或 未 调 至 
最 优 ， 那 就 可 能 会 影响 整个 系统 的 性 能 。 您 如 何 才 能 捕捉 这 些 糟糕 的 查询 呢 ? 

动态 SQL 语句 快照 提供 了 应 用 程序 所 运行 的 动态 SQL 语句 的 有 关 信 息 。 按 照 这 些 步 
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CN> db2 reset monitor all 
Cc:\> 运行 DB2 测试 程序 


又 重 置 监控 由 ， 运 行 DB2 性 能 测试 程序 ， 然 后 获得 动态 SQL 语句 的 快照 


C:\> db2 get snapshot for dynamic sq1L on TESTDB 


下 和 面 展示 了 部 分 动态 SQL 快照 的 输出 。 
动态 SQL 快照 : 


Dynamic SQL Snapshot Result 


Database name = TESTBB 
Database path = C:\DB2\NODEO0O000\SOLOO000G\ 
Number of executions = 1 

Number of compilations = 1 

Worst preparation time (ms) = 0 

Best preparation time (ms) = 

Tnternal rows deleted = 

Internal rows linserted = 0 

RowS read = 100000 
Internal rows updated = 

Rows written = 0 

Statement sorts = 

Statementl seort Overfliows = 

Total sort 七 Ime = 0 

Buffer pool data logical reads = 1820 
Buffer pool data physical reads ey 
Ruffer pool temporary data logical reads = 0 
Buffer pool temporary data physical reads = 0 
Buffer pool index logical reads = 0 

Buffer pool index physical reads = 0 

Buffer pool temporary lindex loglcal reads = 0 
Buffer pool temporary lindex physical reads = 0 
Total execution time (sec.ms) = 0 A933] Fy 
Total User cpu 七 Ime (sec.ms) ~ 0O0.040051 
Total system cpu time (sec.ms) = 0.010014 
Statement text = SELECT NAME, BALANCE FROM 


ACCOUNT WHERE 


Number of executions = 1 
Number of compilations = 1 
Worst preparation time (ms) = 0 
Best preparation time (ms) = 0 
Internal rows deleted a 
Internal rows inserted = 


ACCT TD =—14680 
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ROWS read = 100000 
Internal rows updated = 0 

Rows written = 0 

Statemant sorts 三 上 

Statement sort overflows = 

Total sort 七 Ime = 0 

Buffer pool data logical reads = 
Buffer pool data physical reads Sa 
Buffer pool temporary data logical reads = 0 
Buffer pool temporary data physical reads = 0 
Buffer Pool index logical reads = 0 

Rufter Bool ndex physical Teads —= | 


Buffer pool temporary index loglical reads = 0 
Buffer pool temporary index physical reads = 0 


Total execution time (sec.ms) = 1.034426 
Total user cpu time (sec.ms) ~ 0.040058 
Total system cpu time (sec.ms) = .000000 
statement text = SELECT NAME, BALANCE FROM 


ACCOUNT WHERE ACCT ID =417030 


Number of execut1ons = 3 

Number of compilations = 1 

Worst preparation time (ms) 二 132 

Best preparation time (ms) 三 天 工学 
IntLernal rows deleted 二 

Internal rows inserted 三 是， 

RowS read = 0 

Internal rows updated = 

Row3S written = 了 3 

Statement sorts = 0 

talLementl sortl overf lows 0 

Total sort time = 0 

Buffer pool data logical reads = /8 

Buffer pool data physical reads 2 

Buffer pool temporary data logical reads = 0 
Buffer pool temporary data physical reads = 0 
Puffer pool index logical reads = 0 

RBuffer pool index physical reads = 0 

Buffer pool temporary index loglical reads = 0 
Buffer pool temporary index physical reads = 0 


Total execution time (sec.ms) = 
Total user cpu time (sec.ms) = .000000 
Total system cpu time (sec.ms) = 0.000000 
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Statement text 


= INSERT INTO 
AUNDIT TLOC WAUUIES (0 2 539 


我 们 提取 了 与 3 个 不 同 查 询 相 对 应 的 3 部 分 动态 SQL 快照 : 


SELECT NAME, BALANCE FROM ACCOUNT WHERE ACCT ID =14680 
SELECT NAME, BALANCE FROM ACCOUNT WHERE ACCT ID =417030 


INSERT INIO AUDITLOG VALUES 


| mee on a 


PD may 


请 注意 , 除了 ACCT DID 的 值 之 外 , 这 两 条 SELECT 语句 完全 相同 。 本 例 中 故意 将 DB2 
性 能 测试 程序 编码 为 不 具有 参数 标记 (?)， 以 显示 您 不 应 做 什么 ! DB2 优化 器 将 这 两 条 
SELECT 语句 看 作 不 同 的 全 询 ， 因 此 将 分 别 编译 每 条 查询 从 而 导致 额 外 开销 ， 如 以 下 和 字段 


所 不 : 


Number of executions 


男 一 方面 ， 如 果 查 看 INSERT 语句 ， 


一 二 
Number of compilations = 


Number of executions = 73 


Number of compilations = 


上 面 显示 上 只 再 要 一 次 编 详 ， 


就 可 以 看 到 它 使 用 了 5 个 参数 标记 (? ) 字 段 : 


具有 个 同 值 的 同一 会 询 执 行 了 73 次 。 


接 看 ， 让 我 们 捕获 糖 糙 的 SQL 语句 。 通 过 操作 系统 命令 ,您 可 以 将 快照 命令 的 输出 重 
独 定 同 到 文件 ， 如 下 所 示 : 


C:\> db2 get snapshot for dynamic sql on TESTDB > snapl.txt 

然后 ， 可 以 使 用 编辑 占 查 找 池 段 “Total execution time”( 如 果 是 中 文 环境 ， 奉 找 “ 执 
行 数 ”， 其 他 字段 类 似 )。 控 照 降序 对 结果 进行 排序 ， 并 开始 分 析 上 共有 最 融 值 的 伍 询 。 例 如 ， 
在 我 们 的 Windows 系统 中 ， 我 们 安装 了 一 个 UNIX 模拟 器 ， 因 此 ， 我 们 可 以 使 用 grep 命 


< 如 下 所 示 : 


C:\> grep -1i 7 Total execution'" 


这 将 提供 一 个 列表 ， 如 下 所 示 : 


查找 糟糕 的 查询 


Total execution 
Total executjon 
Total execution 
Total execut1on 


(Sec 
(Sec 
(Sec 
(Sec 


.InS) 
.InS) 
-IILS) 
-ITLS ) 


snapl .txt 


J 


-4/1/1460 
.034426 
.3241106 
-197684 


Total 
Total 
Total 
Total 
Total 
Total 
Total 
Total 
Total 
Total 
Total 


executlion 
execut1lion 
executlion 
executlion 
executlion 
executlion 
executlion 
executlion 
executlion 
executlion 
executlion 


time 
time 
time 
time 
time 
time 
time 
time 
time 
time 
time 


(Sec 
(Sec 
(Sec 
(Sec 
(Sec 
(Sec 
(Sec 
(Sec 
(Sec 
(Sec 
(Sec 


.InSs) 
-IILS) 
-ITLS ) 
-ITLS ) 
-ITTIS) 
-ITLS ) 
-ImLS ) 
-ITTIS) 
.InS) 
-ITLS ) 
-ITTIS) 
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-4016713 
-820391 
-000000 
a a 
.436514 
. 442380 
-44 339396 
0.300309 
41 .844224 
1.0538021 


= 


= 0.394608 
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虽然 我 们 没有 排序 该 列表 ， 但 可 以 立即 看 到 具有 了 节 局 执行 时 间 的 得 询 是 41.844554。 
下 面 展示 了 动态 SQL 快照 输出 中 针对 该 得 询 的 那 部 分 。 

糟糕 查询 的 动态 SQL 快照 区 域 

Number of executions = 77 

Number of compilations = 1 


(ms ) 一 0 
Best preparation time (ms) = 0 


Worst preparation time 


Internal rows deleted = 0 
Internal rows inserted 三 必 
ROWS read = IV00000 
Internal rows updated = 0 
Rows written = 
statement sorts 一 0 
Statement sort overflows = 0 


La 


Total sort time = 

= 1]40140 

= 124493 

Buffer pool temporary data logical reads = 0 
0 


Buffer 在 GO data 10g1ical reads 
Buffer pool data physical reads 


Buffer pool temporary data physical reads = 
= 0 
index physical reads = 0 


Buffer pool index logical reads 
Buffer pool 
Buffer Pool temporary lindex loglcal reads 0 

Buffer pool temporary index physical reads = 0 

Total execution time (sec.ms) = 41.844554 

(Sec.ms) = 2. 14394]1 

Total System cpu time (sec.ms) = 1.061323> 

statement text = UPDATE ACCOUNT SET BALANCE = 2 

WHERE ACCT DS 3 


通过 分 析 访 输出， 我 们 注意 到 该 僵 询 已 经 执行 了 了 77 次 。 因 此 ，41.844554 的 总 执行 就 


Total user cpu time 
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是 77 次 执行 。 用 41.844554 除 以 77， 我 们 得 到 每 个 查询 的 执行 就 是 0.5434358。 因 此 ， 它 
并 韭 和 看 上 去 的 一 样 糟 灿 。 是 否 可 以 提高 该 查询 昵 ? 当 然 可 以 。 行 读 取 的 数目 (77) 表 明 很 
可 能 发 生 表 扫描 。 然 而 ， 这 并 非 一 定 是 代价 最 高 的 查询 。 如 果 我 们 重复 与 前 面相 同 的 过 程 ， 
就 会 发 现 具 有 该 执行 时 间 的 查询 : 


Total execution time (sec.ms}) = 1.034426 
实际 上 是 花费 最 多 时 间 的 合 询 。 有 问题 的 查询 是 : 
SELECT NAME, BALANCE FROM ACCOUNT WHERE ACCT ID =41030 5 


快照 中 针对 该 得 询 的 完整 部 分 已 经 包含 在 前 面 的 例子 中 了 。 下 面 我 们 讲解 如 何 调整 该 
但 询 。 


3) 理解 访问 计划 

此 处 关注 如 何 理解 访问 计划 本 和 号 ， 以 便 您 可 以 确定 糟糕 查询 的 根本 原因 ， 然 后 解决 该 
加 题 。 

下 面 的 示例 通过 分 析 我 们 在 前 面 捕 获 的 糟糕 查询， 介绍 访问 计划 的 基础 知识 。 

创建 脚本 文件 select.qd1， 其 中 包含 下 列 SELECT 语句 : 


SELECT NAME, BALANCE from ACCOUNT WHERE ACGCT TD—47030; 
可 以 执行 下 列 步 又， 用 于 为 以 上 SELECT 语句 生成 访问 计划 : 


:\> db2 connect to TESTDB 

:\> db2 set current explain mode explain 

:\> db2 -tvf select.ddl 

:\> db2 set current explaln mode no 

MRexEmE 7 TESTDORBY 0 TIC WW 0 NY 50 0 eo Explarmn on 


db2exfmt 输出 的 结构 

在 explain.out 文件 中 ， 您 可 以 看 到 db2exfimt 的 输出 显示 了 许多 关于 数据 库 环境 和 查 
询 的 宇 叶 人 信息。 下 向 列 出 了 一 些 重要 的 区 域 。 

Database Context 区 域 列 出 了 优化 器 在 人 确定 具有 最 少 资源 成 本 的 访问 计划 时 所 考虑 的 
配置 参数 。 

db2exfmt 输出 的 Database Context 区 域 : 


(af ta 


Database Context: 


Parallelism: None 
EPO Speed: .00032636 人 001 
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Comm Speed: 0 
Buffer Pool silze: 250 
Sort Heap size: 400 
Database Heap slize: 600 
Louk 让 本 本 < 50 
Maximum Lock List: 人 22 
Average Applications: 1 
Locks Avalilable: T1222 


Package Context 区 域 提供 了 程序 包 的 细节 ， 例 如 SQL 是 动态 的 还 是 静态 的 、 优 化 级 
别 以 及 隔离 级 别 。 更 重要 的 是 ,您 可 以 看 到 section 编写 以 及 从 何 处 发 出 的 查询 (QUERYTAG: 
CLP)。 当 您 将 访问 计划 和 草 刹 罗 配 事件 监控 融 输 出 时 ， 这 极其 有 用 。 它 允许 我 们 更 好 地 跟踪 
特定 的 租 询 和 有 关 事 件 。 

db2exfmt 输出 的 Package Context 区 域 : 


Package Context: 


SQL TYPe : Dynamic 
Optimization Level: 3 

Blocking: Bloeck ALl Cursors 
Isolation Level: Cursor Stabrlity 


一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 STATEMENT 1 SECTION 201 ———————-————————-— 


QUERYNO: 4 
QUERYTAG: CLP 
Statement Type: SeEectk 
Updatable: No 
DeTletable: NO 
ery Degree: 1 


下 面 展 示 了 初始 碍 询 语句 及 其 优化 版 本 。 
db2exfmt 输出 的 初始 和 优化 区 域 ; 


Original statement: 

select name,balance from account where SEEE 1d=—47030 
optimized Statement : 

SELECT Ql1.NAME AS “NAME™”, Ql1.BALANCE AS "BALANCE" 

FROM YUAN .ACCOUNT AS Ql 

WHERE (Ql ACCT JD = 41030) 


下 面 展示 了 SELECT 语句 的 访问 计划 。 
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db2exfmt 输出 的 Access Plan 区 域 . 


ACCeSS Plan: 
ToLlal Cost: 3420 .41 
Daerv Daegqrec.: 1 
ROW3S 
RETURN 
( 1) 
E03 
I/O 
1 
TBSCAN 
( 22) 
3420.41 
i1820 
| 
100000 
TABLE: YUAN 
ACCOUNT 


其 余 的 两 个 区 域 提供 了 关于 访问 计划 的 每 个 操作 符 以 及 但 询 所 使 用 的 表 和 /或 索引 的 
访问 计划 操作 符 
下 面 展 示 了 访问 计划 的 基本 组 件 : 
cardinality 
<acCeGess Plan operator> 
| 
COS 
FA D3 


基数 (cardinality) 表 示 访 问 计 划 操 作 符 返回 的 行 的 估计 数目 。 访 问 计划 操作 符 要 么 是 必 
须 在 数据 上 执行 的 动作 ， 要 么 是 表 或 索引 的 输出 。 成 本 (cosb 表 示 该 操作 以 及 前 面 操作 的 
CPU 累计 成 本 ， 而 IO 成 本 (IO cost) 表 示 LO 子 系统 中 的 操作 符 成 本 。 

成 本 单位 (unit of cost) 是 timeron。timeron 不 直接 等 于 真正 的 时 间 消 耗 ， 但 是 对 数据 库 
官 理 右 所 需 的 资源 (成 本 ) 给 出 了 相对 粗略 的 估算 。 

下 面 是 您 可 以 在 本 书 中 看 到 的 一 些 访问 计划 操作 符 例子 。 

e。 RETURN: 表示 从 但 询 到 用 户 的 数据 返回 。 

e FETCH: 使 用 指定 的 记录 标识 从 从 表 中 读 取 列 。 
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e TBSCAN: 通过 和 卫 接 从 数据 页 中 读 取 所 有 必要 的 数据 来 检索 行 。 
e IXSCAN: 用 可 选 的 局 动 /停止 条 件 扫 手表 的 索引 ， 生 成 有 序 的 行 流 。 


4) 表 扫 描 与 索引 扫描 

如 果 没 有 创建 合适 的 索引 ,或 者 索引 扫 摘 的 成 本 更 局 一 些 , 优化 器 通 弟 束 选 择 表 扫 拉 。 
当 表 十 分 小 且 索 引 和 集群 率 (index-clustering ratio) 十 分 低 ， 或 合 询 需要 很 多 表 行 时 ， 索 引 扫 摘 
的 成 本 可 能 更 局 。 

前 面 的 访问 计划 显示 SELECT 语句 的 总 成 本 是 3420.41 timeron， 这 来 目 于 表 扫 搓 操作 
从 (TBSCAN) 对 ACCOUNT 表 进 行 的 操作 。 因 为 该 SELECT 语句 的 结果 集中 只 期 望 一 行 ， 
所 以 表 扫 描 在 这 里 被 认为 是 代价 较 珊 的 操作 。 或 者 ， 可 以 尝试 过 引 扫描 ， 以 便 取得 更 好 的 

在 进行 创建 索引 的 工作 之 前 , 您 可 以 运行 DB2 性 能 测试 程序 来 获得 性 能 基线 ， 以 便 稍 
后 进行 比较 。 在 本 例 中 ，10 秒 中 使 用 12 000 个 4KB 页 面 缓冲 池 完 成 的 事务 数目 是 $98， 
如 前 面 的 几 11-18 所 示 。 

在 ACCOUNT 表 上 创建 索引 ， 如 下 所 示 : 

CA> db2 connect to TESTDB 


CN db2 describe table account 
CN Op "eroeate Index acct gg tnx On acecount (acet 119 


用 RUNSTATS 命令 更 新 目录 统计 数据 ， 以 便 优 化 器 可 以 考虑 这 个 新 创建 的 索引 : 
CE: db2 runstats on table account with distribution and detalled indexes all 
为 了 在 ACCOUNT 表 上 创建 案 引 之 后 评估 新 的 访问 计划 ， 要 发 出 : 


C:\> db2 set current explain mode explain 

CN> db2 “taf select ddl 

C:\> db2 set current explain mode no 

CN>db2extmb dTESTHB Gg TIC WoT WO SOP HU oxplam Index out 


下 和 面 展示 了 新 的 访问 计划 : 


ACCeSS Plan: 
Total COSt: 了 丰 之 十 己 
Her ee L 
ROWS 
RETURN 
(1) 
Cost 


521 


522 
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I/0 

| 

| 
FETCH 
( 二) 
38.6219 


CE 
1 100000 
IXSCAN TABLE: 
( 二 ACCOUNT 
wy ol2 
2 
| 
100000 
INDEX: 
ACET TD TNX 


通过 在 ACCT ID INX 列 上 添加 索引 ， 新 的 访问 计划 显示 了 从 3420.41 到 38.6219 timeron 
的 大 幅度 成 本 减 小 。 

图 11-20 展示 了 创建 索引 之 后 DB2 性 能 测试 程序 的 性 能 得 到 了 极 大 提高 ,从 598 个 事 
务 提 高 到 1744 个 事务 。 


| 


性 稻 讽 i 直 证 置 
交 据 库 考 TESTDB 
测试 时 间 I10 种 
训 | 试 结果 
已 完成 的 变易 数目 
1744 
已 耗 时 
10.0 sec 


图 11-20 ”使 用 ACCOUNT 表 上 的 索引 扫描 的 性 能 结果 
7. 实验 总 结 


这 个 使 用 Java 示例 程序 (DB2 性 能 测试 程序 ) 的 调 优 练习 介绍 了 DB2 性 能 监控 和 调 优 的 
基础 知识 。 您 可 以 应 用 这 些 和 傈 单 的 一 步 步 的 性 能 调 优 示例 来 提高 您 目 己 的 DB2 数据 库 系 统 
的 性 能 。 此 外 ， 您 也 有 机 会 了 解 如 何 评估 和 分 析 访 问 计 划 ， 并 修复 “糟糕 的 查询 ”。 


